期刊文章详细信息
文献类型:期刊文章
机构地区:[1]山东政法学院信息科学技术系,济南250000
年 份:2008
卷 号:8
期 号:9
起止页码:2481-2483
语 种:中文
收录情况:RCCSE、ZGKJHX、普通刊
摘 要:分词模块是中文搜索引擎的一个重要组成部分,针对分词提出了一种最短路径与共首字歧义词概率的比较相结合的方法,首先寻找最短路径。如果最短路径不只一条,就比较共首字歧义词概率,选择概率较大的一条路径,效果非常明显。对未登录词识别提出了一种改进的移动窗口算法,在单字序列中移动窗口,并记录状态来寻找新词,能够识别大部分的未登录词。
关 键 词:中文分词 未登录词识别 最短路径 共首字歧义词概率 窗口移动法
分 类 号:TP391.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...