登录    注册    忘记密码

期刊文章详细信息

中文微博用户性别分类方法研究    

User Gender Classification in Chinese Microblog

  

文献类型:期刊文章

作  者:王晶晶[1] 李寿山[1] 黄磊[1]

机构地区:[1]苏州大学计算机科学与技术学院自然语言处理实验室,江苏苏州215006

出  处:《中文信息学报》

基  金:国家自然科学基金(61375073)

年  份:2014

卷  号:28

期  号:6

起止页码:150-155

语  种:中文

收录情况:BDHX、BDHX2011、CSCD、CSCD2013_2014、JST、RCCSE、ZGKJHX、核心刊

摘  要:该文旨在研究中文微博用户的性别分类问题,即根据微博提供的中文文本信息对注册用户的性别进行识别。虽然基于微博的性别分类已经有一定研究,但是针对中文的性别分类工作还很缺乏。该文首先提出分别利用用户名和微博文本构建两个分类器对用户的性别类型进行判别,并对不同的特征(例如,字特征、词特征等)进行了研究分析;其次,在针对用户名和微博文本的两个分类器的基础上,使用贝叶斯融合方法进行分类器融合,从而达到采用这两种文本分类信息同时对用户性别进行性别判断。实验结果表明该文的方法可以达到较高的识别准确率,并且分类器融合的方法明显优于仅利用用户名或者微博文本的分类方法。

关 键 词:性别分类 新浪微博  文本分类 社交网络

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心