期刊文章详细信息
文献类型:期刊文章
机构地区:[1]杭州电子科技大学计算机应用技术研究所,浙江杭州310018
基 金:浙江省自然科学基金项目(M603025)
年 份:2007
卷 号:25
期 号:7
起止页码:1046-1051
语 种:中文
收录情况:BDHX、BDHX2004、CSSCI、CSSCI2006_2007、JST、NSSD、RCCSE、RDFYBKZL(收录号:348591)、RWSKHX、ZGKJHX、核心刊
摘 要:文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析,指出了当前中文文本挖掘研究中存在的主要问题和主要研究方向。最后提出了一个统一的中文文本挖掘模型——UCT-MF。该模型具有层次性、开放性和可扩展性,为中文文本挖掘系统提供了基本体系框架。
关 键 词:文本挖掘 数据挖掘 中文文本挖掘模型 中文信息处理
分 类 号:G354]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...