中国科学院计算机语言信息工程研究中心 
导出分析报告

研究主题:机器翻译 机器翻译系统 中文信息处理 自然语言处理 IHSMTS
研究学科:自动化类 电子信息类 经济学类 环境科学与工程类
被引量:1,062H指数:16EI: 14 北大核心: 65 CSSCI: 10 CSCD: 58 RDFYBKZL: 1
-
排序方式:
- 中文文本分类中特征抽取方法的比较研究
- 1
- 《中文信息学报》南京理工大学计算机科学系;中国科学院计算机语言信息工程研究中心 代六玲 黄河燕 陈肇雄 出版年:2004
- 国家自然科学基金资助项目 (6 0 2 72 0 88)
- 本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机 (SVM )和KNN两种不同的分类器以考察不同抽取方法的有效...
- 关键词:计算机应用 中文信息处理 文本自动分类 特征抽取 支持向量机 KNN
- 知网的理论发现
- 2
- 《中文信息学报》中国科学院计算机语言信息工程研究中心 董振东 董强 郝长伶 出版年:2007
- 知网正式发布至今已经8年了。海内外很多人对它已不陌生了。现在该是我们为知网的理论发现做点小结的时候了。本文它们包括(1)知网的知识观,(2)关于知识的获取和表达,(3)事件类概念分类的双轴论,(4)关于语义角色,(5)知...
- 关键词:计算机应用 中文信息处理 知识系统 本体论 义原 语义角色 WORDNET
- Web缓存技术综述
- 3
- 《小型微型计算机系统》南京理工大学计算机系;中国科学院计算机语言信息工程研究中心 贺琛 陈肇雄 黄河燕 出版年:2004
- Web高速缓存 ( Web Caching)技术实现了 Web内容的关键节点 (包括本地 )存储 ,它能减少网络带宽的占用 ,降低硬件成本 ,改善响应时间 ,提高了最终用户的效率 .本文通过对 Web缓存的分类、性能指标...
- 关键词:缓存 策略 替换算法
- 面向信息处理的词汇语义研究中的若干问题
- 4
- 《语言文字应用》中科院计算机语言信息中心.语言知识研究室 董振东 董强 出版年:2001
- 本文概述了国家社会科学“九五”重大项目“信息处理用现代汉语词汇研究”中的子课题“现代汉语知识词典的建立和词汇内部语义网络描述”取得的成果 ,着重讨论了在研究过程中曾面临的一些策略性和方法论的问题。笔者把它们归纳为五个关系...
- 关键词:信息处理 词汇 语义研究 现代汉语 语义知识 分类
- 图象编码时小波基的选择
- 5
- 《中国图象图形学报(A辑)》中科院计算机语言信息工程研究中心;北京西三环中路19号33研究所 胡春玲 陈义宽 马常楼 出版年:1998
- 小波变换用于图象压缩时,小波基的一些性质与编码的效果有很大的关系。本文在实验数据的基础上分析了小波的正交性、双正交性与正则性和消失距对静态图象编码的影响,从而给出了选择的原则。
- 关键词:小波基 图象编码 正交性 双正交性 消失距
- 中文新词识别技术综述
- 6
- 《计算机科学》中国科学技术大学计算机科学与技术学院;新疆师范大学计算机系;中国科学院计算机语言信息工程研究中心 张海军 史树敏 朱朝勇 黄河燕 出版年:2010
- 国家自然科学基金项目(60672149);国家863计划重点项目(2006AA010109)资助
- 新词识别是中文信息处理领域的关键技术。新词识别主要包括候选字串的提取过滤和词性猜测两项任务。中文没有特定符号标志词边界,因此任何相邻字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词...
- 关键词:新词识别 未登录词 候选字串 训练语料 词性猜测
- 一种采用聚类技术改进的KNN文本分类方法 ( EI收录)
- 7
- 《模式识别与人工智能》中国科学院计算机语言信息工程研究中心 张孝飞 黄河燕 出版年:2009
- 国家自然科学基金项目(No.60672149);国家863计划项目(No.2006AA010109)资助
- KNN算法稳定性好、准确率高,但由于其时间复杂度与样本数量成正比,导致其分类速度慢,难以在大规模海量信息处理中得到有效应用.文中提出一种改进的KNN文本分类方法.其基本思路是,通过文本聚类将样本中的若干相似文档合并成一个...
- 关键词:k-最近邻(KNN) 文本分类 文本聚类 聚类中心 自然语言处理
- 智能教学系统中的知识树增长模型 ( EI收录)
- 8
- 《计算机研究与发展》北京语言文化大学网络教育学院;中国科学院计算机语言信息工程研究中心 周晓军 黄河燕 张普 出版年:2001
- 国家自然科学基金资助 ( 69882 0 0 6)
- 智能教学系统 ( intelligent tutoring system,ITS) ,作为人工智能学科的重要研究应用领域 ,是 2 1世纪人类社会数字化教育的必然发展方向 ,迄今研究逾 3 0年 .现有一些 ITS系统由...
- 关键词:智能教学系统 人工智能 知识树增长模型 多媒体教学
- 基于语句相似度计算的FAQ自动回复系统设计与实现
- 9
- 《小型微型计算机系统》南京理工大学计算机系;中国科学院计算机语言信息工程研究中心 张亮 冯冲 陈肇雄 黄河燕 出版年:2006
- 国家自然科学基金项目(60272088)资助
- FAQ(Frequently Asked Question)在互联网站上广泛使用,但绝大多数FAQ的检索与回复都是手工进行.本文介绍了一个较为完整的基于语句相似度计算的FAQ自动回复系统,包括基本计算模型的选取、FAQ特...
- 关键词:FAQI VSM 相似度计算 信息检索
- 基于条件随机域的复杂最长名词短语识别
- 10
- 《小型微型计算机系统》中国科学技术大学计算机科学与技术系;中国科学院计算机语言信息工程研究中心;南京理工大学计算机系 冯冲 陈肇雄 黄河燕 张亮 王江伟 出版年:2006
- 国家自然科学基金项目(60272088)资助;国家"八六三"基金项目(2002AA11401)资助.
- 识别句子中的最长名词短语是一个对机器翻译等任务具有重要实际价值的难题.为了克服传统方法在处理词之间的长程关联的不足和标注偏置等问题,本文采用条件随机域建立统计模型,有针对性的研究了复杂最长名词短语的识别,并给出了一种带置...
- 关键词:最长名词短语 条件随机域 机器翻译