登录    注册    忘记密码

东北大学自然语言处理实验室 收藏

导出分析报告

研究主题:机器翻译    文本分类    统计机器翻译    自然语言处理    中文    

研究学科:自动化类    交通运输类    电子信息类    

被引量:153H指数:7WOS: 2 EI: 5 北大核心: 26 CSCD: 26

-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
排序方式:

87 条 记 录,以下是 1-10

基于领域词典的文本特征表示 ( EI收录)
1
《计算机研究与发展》东北大学自然语言处理实验室 陈文亮 朱靖波 朱慕华 姚天顺  出版年:2005
国家自然科学基金和微软亚洲研究院联合资助项目(60203019);国家自然科学基金项目(60473140);国家教育部科学技术研究重点项目(104065)~~
为提高文本分类性能,提出一种结合机器学习和领域词典的文本特征表示方法·基于领域词典的文本特征表示方法可以增强文本特征表示能力,并降低文本特征空间维数,但是领域词典存在覆盖度不足的问题·为此,提出一种学习模型———自划分模...
关键词:文本分类 知识获取 领域知识 文本表示
基于维基百科类别的文本特征表示
2
《中文信息学报》东北大学自然语言处理实验室;医学影像计算教育部重点实验室(东北大学) 王锦 王会珍 张俐  出版年:2011
国家自然科学基金资助项目(60873091;61073140);中央高校基本科研业务费专项资金;高等学校博士学科点专项科研基金资助项目(20100042110031)
该文提出了基于维基百科类别体系的文本特征表示方法,方法是将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示。基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低文本特征空间维数。针对维基百科...
关键词:文本分类 维基百科类别  文本表示
模板驱动的神经机器翻译 ( EI收录)
3
《计算机学报》东北大学自然语言处理实验室;澳门大学自然语言处理与中葡机器翻译实验室;沈阳雅译网络技术有限公司 李强 黄辉 周沁 韩雅倩 肖桐 朱靖波  出版年:2019
国家自然科学基金(61432013;61732005;61672555);中央高校基本科研业务费;澳门大学多年度研究资助(MYRG2017-00087-FST;MYRG2015-00175-FST;MYRG2015-00188-FST);澳门科学技术发展基金;国家自然科学基金联合科研资助项目(045/2017/AFJ)资助~~
由于神经机器翻译模型简单、通用和有效,神经机器翻译模型已成为目前最受关注的机器翻译模型.在神经机器翻译模型中,通过引入词汇翻译表和短语翻译表可以提高翻译质量.然而,对于已经存在的人工整理的翻译模板或者启发式算法生成的翻译...
关键词:人工智能 自然语言处理 神经机器翻译  翻译模板 门阀
基于句对质量和覆盖度的统计机器翻译训练语料选取
4
《中文信息学报》东北大学自然语言处理实验室;医学影像计算教育部重点实验室(东北大学) 姚树杰 肖桐 朱靖波  出版年:2011
国家自然科学基金资助项目(60873091;61073140);中央高校基本科研业务费专项资金;高等学校博士学科点专项科研基金资助(20100042110031)
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降低训练和解码代价。该文综合覆盖度和句对翻译质量两方面因素,提出一种从已有平行语料中获取高质量小规模...
关键词:句对质量评价  覆盖度 统计机器翻译 线性句对质量评价模型  训练语料选取  
面向神经机器翻译的集成学习方法分析
5
《中文信息学报》东北大学自然语言处理实验室;新疆大学信息科学与工程学院 李北 王强 肖桐 姜雨帆 张哲旸 刘继强 张俐 于清  出版年:2019
国家自然科学基金(61876035;61732005;61562082);中央高校基本科研业务费;辽宁省高等学校创新人才支持计划
集成学习是一种联合多个学习器进行协同决策的机器学习方法,应用在机器翻译任务的推断过程中可以有效整合多个模型预测的概率分布,达到提升翻译系统准确性的目的。虽然该方法的有效性已在机器翻译评测中得到了广泛验证,但关于子模型的选...
关键词:集成学习  参数平均  模型融合  多样性
稀缺资源机器翻译中改进的语料级和短语级中间语言方法研究 ( EI收录)
6
《计算机学报》东北大学自然语言处理实验室 李强 王强 肖桐 朱靖波  出版年:2017
中央高校基本科研业务专项资金(N140406003);国家留学基金;国家自然科学基金(61272376;61300097)资助~~
该文以英语作为中间语言的方式对在没有直接的外国语至汉语平行训练数据条件下构建统计机器翻译系统的问题进行研究.文中将基于中间语言的机器翻译方法分为系统级、语料级以及短语级中间语3种方法.在文中提出的改进的语料级中间语方法中...
关键词:自然语言处理  统计机器翻译 外国语翻译  中间语言 语料构建  
基于Bootstrapping的文本分类模型
7
《中文信息学报》东北大学自然语言处理实验室 陈文亮 朱慕华 朱靖波 姚天顺  出版年:2005
国家自然科学基金;微软亚洲研究院联合资助项目 (6 0 2 6 0 319);教育部科学技术研究重点资助项目 (10 4 0 6 5 ) ;国家自然科学基金资助项目 (6 0 4 714 0 )
本文提出一种基于Bootstrapping的文本分类模型 ,该模型采用最大熵模型作为分类器 ,从少量的种子集出发 ,自动学习更多的文本作为新的种子样本 ,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子...
关键词:计算机应用 中文信息处理 文本分类 最大熵模型 权重因子  
基于领域类别信息C-value的多词串自动抽取
8
《中文信息学报》东北大学自然语言处理实验室 李超 王会珍 朱慕华 张俐 朱靖波  出版年:2010
国家自然科学基金资助项目(60873091);辽宁省自然科学基金资助项目(20072032);沈阳市科学技术计划资助项目(1081235-1-00)
该本的多词串抽取是自然语言处理领域一项重要的研究内容。该文提出了一种多类别C-value(Multi-Class C-value)方法,利用多词串在不同领域的分布信息改善领域相关的多词串抽取的性能。在汽车、科技和旅行三个...
关键词:计算机应用  中文信息处理 多词串抽取  多类别C-value  领域信息
从粗粒度到细粒度的神经机器翻译系统推断加速方法
9
《厦门大学学报(自然科学版)》东北大学自然语言处理实验室;沈阳雅译网络技术有限公司 张裕浩 许诺 李垠桥 肖桐 朱靖波  出版年:2020
国家自然科学基金重点项目(61732005,61432013);国家重点研发计划(2019QY1801);国家自然科学基金(61876035);网络文化与数字传播北京市重点实验室开放课题。
近年来,Transformer模型中多层注意力网络的使用有效提升了翻译模型的译文质量,但同时大量注意力操作的使用也导致模型整体的推断效率相对较低.基于此,提出了从粗粒度到细粒度(coarse-to-fine,CTF)的方...
关键词:神经机器翻译  模型加速  从粗粒度到细粒度  
神经机器翻译中数据泛化与短语生成方法研究
10
《中文信息学报》东北大学自然语言处理实验室;沈阳雅译网络技术有限公司 李强 韩雅倩 肖桐 朱靖波  出版年:2018
国家自然科学基金(61672138;61432013;61732005)
该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子...
关键词:自然语言处理 神经机器翻译  数据泛化  短语生成  
已选条目 检索报告 聚类工具

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心