登录    注册    忘记密码

哈尔滨工业大学计算机科学与技术学院语言语音教育部-微软重点实验室 收藏

导出分析报告

研究主题:统计机器翻译    机器翻译    自然语言处理    统计翻译模型    知识获取    

研究学科:自动化类    生物科学类    

被引量:175H指数:7WOS: 6 EI: 23 北大核心: 36 CSSCI: 1 CSCD: 35

-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
排序方式:

51 条 记 录,以下是 1-10

基于上下文的查询扩展 ( EI收录)
1
《计算机研究与发展》昆明理工大学云南省计算机应用重点实验室;哈尔滨工业大学语言语音教育部-微软重点实验室 李卫疆 赵铁军 王宪刚  出版年:2010
国家自然科学基金重点项目(60736044);国家"八六三"高技术研究发展计划基金项目(2006AA01Z150);云南省应用基础研究面上项目(2009ZC032M)~~
针对信息检索查询所使用的词可能与文档集中使用的词不匹配从而影响检索效果这一信息检索关键问题,提出了一种基于上下文的查询扩展方法,该方法根据查询的上下文信息对扩展词进行选择,同时考虑到扩展词与整个查询句以及与查询词的位置关...
关键词:信息检索 查询扩展 上下文 语言模型 伪反馈  
生物医学文本挖掘技术的研究与进展
2
《中文信息学报》哈尔滨工业大学教育部-微软语言语音重点实验室 王浩畅 赵铁军  出版年:2008
国家863计划项目(2006AA010108;2006AA01Z150)
生物医学研究是二十一世纪最受关注的研究领域之一,该领域发表了巨量的研究论文,已经达到年平均60万篇以上。如何在规模巨大的研究文献中有效地获取相关知识,是该领域研究者所面临的挑战。作为生物信息学分支之一的生物医学文本挖掘技...
关键词:计算机应用  中文信息处理 生物信息学 文本挖掘 信息抽取 机器学习  
采用CRF技术的军事情报术语自动抽取研究
3
《计算机工程与应用》北京科技大学信息工程学院;北京图形研究所;哈尔滨工业大学教育部-微软语言语音重点实验室 贾美英 杨炳儒 郑德权 杨靖  出版年:2009
国家自然科学基金No.60736044,No.60675030;国家高技术研究发展计划(863)No.2006AA01Z150,No.2006AA010108~~
针对军事情报领域,提出了一种基于条件随机场的术语抽取方法,该方法将领域术语抽取看作一个序列标注问题,将领域术语分布的特征量化作为训练的特征,利用CRF工具包训练出一个领域术语特征模板,然后利用该模板进行领域术语抽取。实验...
关键词:术语抽取 条件随机场 模板  
多民族语言本体知识库构建技术
4
《中文信息学报》中央民族大学信息工程学院;国家语言资源监测与研究中心少数民族分中心;哈尔滨工业大学教育部-微软语言语音重点实验室 赵小兵 邱莉榕 赵铁军  出版年:2011
国家科技支撑计划资助项目(2009BAH41B04);教育部资助项目(MZ115-94)
语义本体是共享概念模型的显示的形式化规范说明,其目标是将杂乱无章的信息源转变为有序易用的知识源。语义本体知识库的构建是文本自动处理的一个重要环节,跨语言信息检索、信息抽取、自动翻译等领域中都有广泛的应用。该文旨在描述统一...
关键词:知识库 语义本体 词典扩充  本体学习
基于无向图序列标注模型的中文分词词性标注一体化系统 ( EI收录)
5
《电子与信息学报》教育部-微软语言语音重点实验室哈尔滨工业大学 朱聪慧 赵铁军 郑德权  出版年:2010
国家自然科学基金(60773069;60973169)资助课题
在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标注有机地统一在一个序列标注模...
关键词:中文分词 词性标注 一体化系统  无向图模型  
短语统计机器翻译的句法调序模型 ( EI收录)
6
《通信学报》哈尔滨工业大学语言语音教育部-微软重点实验室 薛永增 李生 赵铁军 杨沐昀  出版年:2008
国家高技术研究发展计划("863"计划)基金资助项目(2006AA010108;2006AA01Z150)~~
为了处理统计机器翻译中的长距离调序,在基于短语的统计翻译模型的基础上提出了句法调序模型。该模型按照短语切分来分割句法树结构,从而能够避免短语和句法结构的不一致性。在该模型中依据短语对齐和短语内词对齐确定句法树部分结构的调...
关键词:人工智能 统计翻译模型 句法调序  短语
基于链接分析的重要Blog信息源发现
7
《中文信息学报》哈尔滨工业大学教育部-微软语言语音重点实验室 杨宇航 赵铁军 郑德权 于浩  出版年:2007
国家自然科学基金资助项目(60302021;60373101)
本文提出了一种基于链接分析的对Blog信息源进行量化评估的方法,在此基础之上发现重要Blog信息源,既体现了Blog信息的特点,又在一定程度上减小了作弊链接对链接分析结果的影响,能为用户阅读信息提供方便,并可望为Blog...
关键词:计算机应用 中文信息处理 重要Blog信息源  链接分析 评价指标 相关性分析  
Blog网页分类与识别技术研究 ( EI收录)
8
《通信学报》哈尔滨工业大学语言语音教育部-微软重点实验室 郑德权 张迪 赵铁军 于浩  出版年:2007
国家自然科学基金资助项目(60736044);国家高技术研究发展计划("863"计划)资助项目(2006AA01Z150;2004AA11701008)~~
为了找到一种自动将Blog网页区别于其他Web页面的方法,以便针对Blog语料进行内容抽取、对Blog社区进行规律性研究和发现等,针对Blog网页的特点与规律,提出一种根据网页结构和关键字计算相似度的方法识别Blog网页...
关键词:Blog网页识别  相似度计算 网页分类
基于浅层分析的多文档自动文摘技术 ( EI收录)
9
《哈尔滨工业大学学报》哈尔滨工业大学语言语音教育部-微软重点实验室 张姝 赵铁军 郑德权 杨沐昀  出版年:2007
国家自然科学基金资助项目(6030202160375019);国家高技术研究发展计划资助项目(2004AA117010-08)
提出一种基于浅层分析的多文档文摘方法,该方法分析了单文档的结构信息,多文档的统计信息,并利用改进的MMR方法动态地计算文摘候选句子的加入对文摘的贡献,去除冗余信息,最终按照一定时间顺序输出多文档文摘.对生成的英文文摘进行...
关键词:多文档文摘 浅层分析 MMR方法  自动评测
结合本体论和统计方法的跨语言信息检索模型 ( EI收录)
10
《哈尔滨工业大学学报》哈尔滨工业大学教育部-微软语言语音重点实验室 郑德权 李生 赵铁军 于浩  出版年:2008
国家自然科学基金资助项目(60736044);国家高技术研究发展计划资助项目(2006AA01Z150;2004AA11701008)
为了更有效地提高跨语言信息检索的性能,结合本体论和统计方法的特性,提出一种混合的跨语言信息检索模型.在该语言模型的结构上,提出一种本体描述框架,构造了一个形式化的语言本体知识表示,通过典型语料学习,融合了语法、语义、句法...
关键词:跨语言信息检索 本体  统计方法  语言模型 知识获取
已选条目 检索报告 聚类工具

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心