期刊文章详细信息
文献类型:期刊文章
机构地区:[1]广东外语外贸大学图书馆
基 金:国家自然科学基金青年项目"微博虚假信息及早检测与有效控制关键技术研究"(项目编号:61202271);国家自然科学基金项目"不平衡数据的学习算法及应用研究"(项目编号:61070061)研究成果之一
年 份:2013
卷 号:57
期 号:11
起止页码:125-131
语 种:中文
收录情况:BDHX、BDHX2011、CSSCI、CSSCI2012_2013、JST、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。
关 键 词:微博短文本预处理短文本学习 热点事件发现 自动文摘
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...