期刊文章详细信息
文献类型:期刊文章
机构地区:[1]教育部语言文字应用研究所,北京朝内南小街51号100010
基 金:国家社会科学基金(项目号:03BYY019);教育部科研项目(项目号:ZDI105-53A)的资助。
年 份:2005
卷 号:7
期 号:2
起止页码:166-178
语 种:中文
收录情况:BDHX、BDHX2004、CSSCI、CSSCI2004_2005、NSSD、RDFYBKZL(收录号:291994)、RWSKHX、核心刊
摘 要:上下文无关语法在处理句法歧义时遇到了困难,概率上下文无关语法和概率词汇化上下文无关语法为解决句法歧义问题提供了有力的手段。概率语法给一个句子或者单词的符号串指派一个概率,从而捕捉比一般的上下文无关语法更加细致的句法信息。概率上下文无关语法也是一种上下文无关语法,其中的每一个规则都标上选择该规则的概率,处理每一个上下文无关规则时,都假定它们在条件上是独立的,一个句子的概率使用剖析该句子时每一个规则的概率的乘积来计算。CYK算法是一种自底向上的动态规划剖析算法,经过概率上下文无关语法增强之后,概率CYK算法就可以计算在剖析一个句子时的剖析概率。概率上下文无关语法的概率可以通过统计已经剖析好的语料库(树库)中的规则而得到,也可以通过直接剖析尚未加工过的语料库而得到。当剖析的句子有歧义的时候,可以使用向内向外算法来处理。概率词汇化上下文无关语法要考虑每一个规则的词汇中心语,规则的概率要以词汇中心语和邻近的中心语作为它的条件,这样就进一步增强了规则的功能。
关 键 词:自然语言处理 概率 语法 上下文 中心语 句法歧义 歧义问题 动态规划 自底向上 词汇化 语料库 规则 剖析 句子 算法 使用 符号
分 类 号:H04]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...