期刊文章详细信息
文献类型:期刊文章
Mao Wenwei(Shanghai International Studies University,China)
机构地区:[1]上海外国语大学科研处
年 份:2019
期 号:1
起止页码:1-9
语 种:中文
收录情况:CSSCI、CSSCI_E2019_2020、NSSD、RWSKHX、普通刊
摘 要:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
关 键 词:数据挖掘 词频统计 词语共现网络 MI-score 语料库语言学
分 类 号:TP391.1] H36[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...