登录    注册    忘记密码

期刊文章详细信息

中文搜索引擎中的分词技术研究    

Study on the Segmentation of Chinese Search Engine

  

文献类型:期刊文章

作  者:房志峰[1]

机构地区:[1]山东政法学院信息科学技术系,济南250000

出  处:《科学技术与工程》

年  份:2008

卷  号:8

期  号:9

起止页码:2481-2483

语  种:中文

收录情况:RCCSE、ZGKJHX、普通刊

摘  要:分词模块是中文搜索引擎的一个重要组成部分,针对分词提出了一种最短路径与共首字歧义词概率的比较相结合的方法,首先寻找最短路径。如果最短路径不只一条,就比较共首字歧义词概率,选择概率较大的一条路径,效果非常明显。对未登录词识别提出了一种改进的移动窗口算法,在单字序列中移动窗口,并记录状态来寻找新词,能够识别大部分的未登录词。

关 键 词:中文分词 未登录词识别 最短路径 共首字歧义词概率  窗口移动法  

分 类 号:TP391.3]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心