期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京拓尔思信息技术股份有限公司,北京100101
基 金:国家自然科学基金项目(61171159);国家科技支撑计划课题基金项目(2011BAH11B03);北京市教委科技发展计划基金项目(KM201110772021;KM201211232023)
年 份:2013
卷 号:34
期 号:6
起止页码:2175-2179
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD_E2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
关 键 词:术语 边界结合度 串边结合度 双字词性过滤法
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...