期刊文章详细信息
同主题词短文本分类算法中BTM的应用与改进
Application and Improvement of BTM in Short Text Classification Algorithm of the Same Topic
文献类型:期刊文章
机构地区:[1]北京工业大学信息学部多媒体与智能软件技术北京市重点实验室,北京100124
年 份:2017
卷 号:26
期 号:11
起止页码:213-219
语 种:中文
收录情况:CSA、IC、ZGKJHX、普通刊
摘 要:为解决大规模短文本语料库主题模型参数K较大导致求解慢的问题,本文提出FBTM模型,将BTM中单个词对采样复杂度由O(K)降低O(1).针对短文本词语稀疏、描述能力弱的特点,提出一种结合同主题词对与FBTM的短文本分类算法,首先使用FBTM进行主题建模,将一段滑动窗口内的同主题词对作为特征扩充到原文本中,然后使用FBTM主题分布作为另一部分文本特征.对特征扩展后的Weibo语料库进行分类实验,结果显示该方法显著提高了分类性能.
关 键 词:滑动窗口词对 快速双词主题模型(FBTM) 采样 特征扩展 短文本分类
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...