期刊文章详细信息
基于双向LSTM神经网络模型的中文分词
Bi-directional Long Short-term Memory Neural Networks for Chinese Word Segmentation
文献类型:期刊文章
JIN Chen;LI Weihua;JI Chen;JIN Xuze;GUO Yanbu(Science and Engineering Department of YunnanUniversity, Kunming, Yunnan 650503, China;Education Department of Henan Normal University, Xinxiang, Henan 453007, China)
机构地区:[1]云南大学信息学院,云南昆明650503 [2]河南师范大学教育学院,河南新乡453007
基 金:国家自然科学基金(11661081)
年 份:2018
卷 号:32
期 号:2
起止页码:29-37
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD2017_2018、JST、RCCSE、ZGKJHX、核心刊
摘 要:中文分词是中文自然语言处理的基础。分词质量的好坏直接影响之后的自然语言处理任务。目前主流的分词是基于传统的机器学习模型。近年来,随着人工智能大潮的又一次兴起,长短期记忆(LSTM)神经网络模型改进了普通循环神经网络模型无法长期依赖信息的缺点,被广泛应用于自然语言处理的各种任务中,并取得了不错的效果。对中文分词,该文在经典单向LSTM模型上进行改进,增加了自后向前的LSTM层,设计了双向LSTM模型,改进了单向LSTM对后文依赖性不足的缺点;并引入了贡献率α,对前传LSTM层和后传LSTM层的权重矩阵进行调节,并设计了四个实验,验证了所建模型的正确性和优越性。
关 键 词:中文分词 自然语言处理 双向LSTM 贡献率
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...