期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京工业大学计算机学院,北京100124 [2]中国民航信息网络股份有限公司,北京100127
基 金:国家自然科学基金面上项目(61375059);高等学校博士学科点专项科研基金--博导类基金资助项目(20121103110031);北京市教委科研计划重点项目(KZ201410005004);北大方正集团有限公司数字出版技术国家重点实验室开放课题资助项目~~
年 份:2016
卷 号:36
期 号:8
起止页码:2071-2075
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型(LMJM)相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。
关 键 词:中文微博 可信度 信息融合 四象限法则 证据理论
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...