登录    注册    忘记密码

期刊文章详细信息

同主题词短文本分类算法中BTM的应用与改进    

Application and Improvement of BTM in Short Text Classification Algorithm of the Same Topic

  

文献类型:期刊文章

作  者:刘泽锦[1] 王洁[1]

机构地区:[1]北京工业大学信息学部多媒体与智能软件技术北京市重点实验室,北京100124

出  处:《计算机系统应用》

年  份:2017

卷  号:26

期  号:11

起止页码:213-219

语  种:中文

收录情况:CSA、IC、ZGKJHX、普通刊

摘  要:为解决大规模短文本语料库主题模型参数K较大导致求解慢的问题,本文提出FBTM模型,将BTM中单个词对采样复杂度由O(K)降低O(1).针对短文本词语稀疏、描述能力弱的特点,提出一种结合同主题词对与FBTM的短文本分类算法,首先使用FBTM进行主题建模,将一段滑动窗口内的同主题词对作为特征扩充到原文本中,然后使用FBTM主题分布作为另一部分文本特征.对特征扩展后的Weibo语料库进行分类实验,结果显示该方法显著提高了分类性能.

关 键 词:滑动窗口词对  快速双词主题模型(FBTM)  采样 特征扩展  短文本分类  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心