期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南京理工大学自动控制系,江苏南京210094
基 金:国家自然科学基金资助项目 (No .60 1 740 2 8)
年 份:2003
卷 号:31
期 号:11
起止页码:1608-1612
语 种:中文
收录情况:BDHX、BDHX2000、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:2004148102954)、IC、INSPEC、JST、RCCSE、RSC、SCOPUS、ZGKJHX、核心刊
摘 要:文中运用浅层句法分析理论 ,把汉语句子分析划分为标注、组块、构造和检查三个过程 .并针对已有概率评价模型的特征类型少 ,不能充分利用上下文中对分析有用的信息等问题 ,提出了基于最大熵的概率评价模型来评估分析过程中每个行为的概率 .在该模型中 ,对分析有用的任何信息都可以成为模型中的一个特征 ;定义了静态模板结构的特征集和训练集 ,给出了相应的特征选择策略和基于GIS的参数估计算法 ;采取BFS算法高效搜索概率值最高的候选句法树作为最终的句法分析结果 .实验结果表明 :该模型具有较高的分析效率和准确性 .
关 键 词:自然语言处理 最大熵模型 组块 句法分析 广度优先搜索
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...