期刊文章详细信息
文献类型:期刊文章
机构地区:[1]重庆交通大学信息与计算科学研究所,重庆400074
基 金:重庆交通学院高层次人才启动基金项目(2004-2-19)
年 份:2007
卷 号:28
期 号:14
起止页码:3518-3520
语 种:中文
收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD_E2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:给出了Internet网络新闻中文文本自动摘要的基本思路和基本步骤,讨论了断句、分词算法。针对自动摘要中新闻文本的4种形式特征,提出了一套新的自动摘要方案:首先综合新闻文本的4种形式特征对词汇和句子赋予不同的权值,然后根据权值大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅且具备一定质量的摘要。最后实验分析表明效果较好。
关 键 词:自然语言处理 自动摘要 分词 断句 权重 平滑处理
分 类 号:TP319]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...