期刊文章详细信息
文献类型:期刊文章
机构地区:[1]东北大学计算机软件研究所,辽宁沈阳110004
基 金:Supported by the National Natural Science Foundation of China under Grant No.60473140(国家自然科学基金);the National HighTech Research and Development Plan of China under Grant No.2006AA01Z154(国家高技术研究发展计划(863));the Program for New Century Excellent Talents in University under Grant No.NCET050287(新世纪优秀人才支持计划);the National 985 Project of China under Grant No.9852DBC03(国家985工程)
年 份:2007
卷 号:18
期 号:3
起止页码:555-564
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20071810576785)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:提出了一种独立于具体领域的文本线性分割统计模型,其中采用多元判别分析方法定义了4种全局评价函数,实现对文本分割模式的全局评价,寻找满足分割单元内距离最小化和分割单元间距离最大化条件的最好分割方式.该模型采用遗传算法来解决新模型的高计算复杂度问题.比较性实验结果显示,新模型比TextTiling和Dotplotting算法取得了更高的Pμ评价性能.
关 键 词:文本分割 多元判别分析 分割单元内距离 分割单元间距离 分割单元长度 遗传算法
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...