期刊文章详细信息
学术英语文本中连续短语单位的提取方法
A New Computing Measure for Extracting Contiguous Phraseological Units from Academic Texts
文献类型:期刊文章
机构地区:[1]上海交通大学外国语学院,上海200240 [2]上海交通大学语言文字工程研究所,上海200030
基 金:国家社会科学基金项目"基于平行语料库的英汉对应意义单位研究"(07BYY004)
年 份:2010
卷 号:33
期 号:2
起止页码:45-49
语 种:中文
收录情况:BDHX、BDHX2008、CSSCI、CSSCI2010_2011、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:现有的语料库检索软件和统计手段多用于计算两个单词之间的搭配力,而如何测量多个单词之间的黏着力是语料库语言学尚未解决的问题。本文提出新的算法以一阶隐马尔可夫过程为基点,进一步结合Silva和Lopes的"假拟二元序列转化"理论,并以新JDEST语料库为测量对象。通过检验和比较,新算法能够较为有效地改进短语单位的识别与界定,提高计算机自动提取连续短语单位的准确性。
关 键 词:连续短语单位 假拟二元序列转化 概率均值加权法 熵 互信息
分 类 号:H087]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...