登录    注册    忘记密码

北京语言大学信息科学学院语言信息处理研究所 收藏

导出分析报告

研究主题:标点    语料库    自动分词    汉语    相似词    

研究学科:自动化类    电子信息类    经济学类    

被引量:354H指数:12WOS: 1 EI: 4 北大核心: 27 CSSCI: 9 CSCD: 20

-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
排序方式:

70 条 记 录,以下是 1-10

基于语义网计算英语词语相似度
1
《情报学报》北京语言大学语言信息处理研究所 荀恩东 颜伟  出版年:2006
本文介绍一种基于WordNet的计算英语词语相似度的实现方法:从WordNet中提取同义词并采取向量空间方法计算英语词语的相似度。向量包括三方面:(1)WordNet的同义词词集(Synset),(2)类属信息(Clas...
关键词:WORDNET 词语相似度
汉语篇章广义话题结构的流水模型
2
《中国语文》北京语言大学语言信息处理研究所 宋柔  出版年:2013
国家自然科学基金(61171129)的资助;国家自然科学基金(69273042;60872121);北京市自然科学基金(4922003)的资助
本文面向语言工程的需求研究汉语篇章的话题结构。本文的工作以标点句为基本单位,提出广义话题结构的概念和表示方法,归纳出广义话题结构遵从的堆栈模型并拓展为流水模型,指出广义话题结构的两个重要性质:话题的不可穿越性和话题自足句...
关键词:标点句  广义话题结构  话题自足句  堆栈模型  流水模型  
汉语国际教育信息化的发展与展望
3
《语言教学与研究》北京语言大学语言信息处理研究所;中山大学国际汉语学院;中山大学国际汉语教材研发与培训基地 卢达威 洪炜  出版年:2013
本文讨论的汉语国际教育信息化不仅包括传统意义上的计算机辅助汉语课堂教学和多媒体教学资源开发,还包括各种汉语学习、汉语传播平台及辅助汉语教学研究的各类数字化资源建设。我们将汉语国际教育信息化发展划分为起步、全面发展、国际传...
关键词:汉语国际教育 信息化 教育技术 发展阶段  展望  
国外自动作文评分技术研究
4
《外语电化教学》北京语言大学语言信息处理研究所;广东金融学院外语系 葛诗利 陈潇潇  出版年:2007
写作是英语测试中的重要部分,也是提高英语水平的重要手段;但是作文批改需要大量人力、物力,又难以避免其主观性本质。基于统计、自然语言处理以及人工智能技术的自动作文评分给这一问题的解决带来了希望。本文综述国外主流自动作文评分...
关键词:中国英语学习者 英语作文 自动评分技术  自然语言处理
现代汉语跨标点句句法关系的性质研究
5
《世界汉语教学》北京语言大学语言信息处理研究所 宋柔  出版年:2008
国家自然科学基金(60572159)的资助
汉语小句句首成分缺失的现象十分常见,一般作为篇章分析中的零形回指问题去研究,本文则更换角度,看作跨越标点的句法关系问题。本文的工作包括:提出现代汉语中标点句和跨标点句的句法关系的概念,设计了表示跨标点句句法关系的换行缩进...
关键词:标点句  句法关系 共享成分  栈形结构  
一种基于可信度的人名识别方法
6
《中文信息学报》北京工业大学;北京语言大学语言信息处理研究所 罗智勇 宋柔  出版年:2005
国家自然科学基金资助项目 (6 0 2 72 0 5 5 ) ;国家 86 3计划资助项目 (2 0 0 1AA114 111) ;教育部科学技术研究重点资助项目 (0 0 12 8)
专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一。本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了...
关键词:计算机应用 中文信息处理 自动分词 人名识别 统计方法  可信度  
一个基于语境框架的文本特征提取算法 ( EI收录)
7
《计算机研究与发展》中国科学院声学研究所;北京语言大学语言信息处理研究所 晋耀红 苗传江  出版年:2004
国家"九七三"重点基础研究发展规划基金项目 (G19980 3 0 5 0 6)
介绍了一种新的文本语义形式化模型———语境框架 语境框架是一个三维的语义描述 ,它把文本内容抽象成领域(静态范畴 )、情景 (动态描述 )、背景 (褒贬、参照等 ) 3个框架 在语境框架的基础上 ,设计实现了文本特征提...
关键词:文本特征提取 语境框架模型  领域  情景 背景  领域句类  对象语义立场网络  褒贬
基于半监督CRF的跨领域中文分词
8
《中文信息学报》北京语言大学信息科学学院;北京语言大学语言信息处理研究所 邓丽萍 罗智勇  出版年:2017
北京市哲学社会科学规划研究基地项目(13JDZHB005);中央高校基本科研业务费专项资金(09YB09)
中文分词是中文信息处理领域的一项关键基础技术。随着中文信息处理应用的发展,专业领域中文分词需求日益增大。然而,现有可用于训练的标注语料多为通用领域(或新闻领域)语料,跨领域移植成为基于统计的中文分词系统的难点。在跨领域分...
关键词:跨领域  中文分词 半监督CRF  
信息检索用户查询语句的停用词过滤
9
《计算机工程》北京外国语大学中国外语教育研究中心;北京语言大学语言信息处理研究所 熊文新 宋柔  出版年:2007
国家自然科学基金资助项目(60272055);国家"863"计划基金资助项目(2001AA114111);教育部科学技术研究资助重点项目(00128);教育部人文社会科学重点研究基地资助重大项目(02JAZJD740007)
针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉语通用停用词和查询专用的相对停用词,采用左右熵和Ngram方法及KL距离脱机构造相应候选词表。...
关键词:用户查询 停用词 构造  识别  
基于多特征的自适应新词识别 ( EI收录)
10
《北京工业大学学报》北京工业大学计算机学院;北京语言大学语言信息处理研究所 罗智勇 宋柔  出版年:2007
国家自然科学基金(60272055;60572159);国家'八六三'计划资助项目(2001AA114111);教育部科学技术研究重点项目(00128;107017).
为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词...
关键词:自然语言处理系统 计算语言学 词语处理  新词识别 多特征  自适应 自动分词
已选条目 检索报告 聚类工具

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心