期刊文章详细信息
文献类型:期刊文章
机构地区:[1]东北大学计算机软件与理论研究所,辽宁沈阳110004
基 金:国家教育部科学技术研究重点资助项目 (10 4 0 6 5 ) ;国家自然科学基金和微软亚洲研究院联合资助项目 (6 0 2 0 30 19)
年 份:2005
卷 号:19
期 号:3
起止页码:73-79
语 种:中文
收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:采用半指导机器学习方法co training实现中文组块识别。首先明确了中文组块的定义,co training算法的形式化定义。文中提出了基于一致性的co training选取方法将增益的隐马尔可夫模型(TransductiveHMM)和基于转换规则的分类器(fnTBL)组合成一个分类体系,并与自我训练方法进行了比较,在小规模汉语树库语料和大规模未带标汉语语料上进行中文组块识别,实验结果要比单纯使用小规模的树库语料有所提高,F值分别达到了85 34%和83 4 1% ,分别提高了2 13%和7 2 1%。
关 键 词:计算机应用 中文信息处理 co-training算法 中文组块 分类器
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...