登录    注册    忘记密码

西北民族大学中国民族语言文字信息技术重点实验室 收藏

导出分析报告

研究主题:藏语    藏文    声学分析    言语    汉语普通话    

研究学科:自动化类    电子信息类    建筑类    

被引量:210H指数:8EI: 1 北大核心: 14 CSSCI: 1 CSCD: 15

-

检索结果分析

署名顺序

  • 全部
  • 第一机构
结果分析中...
排序方式:

105 条 记 录,以下是 1-10

基于条件随机场的藏语自动分词方法研究与实现
1
《中文信息学报》西北民族大学中国民族语言文字信息技术重点实验室;中国科学院自动化研究所模式识别国家重点实验室 李亚超 加羊吉 宗成庆 于洪志  出版年:2013
国家自然基金资助项目(61032008);模式识别国家重点实验室开放课题资助项目(201001051);西北民族大学中央高校基本业务费专项资金项目(ycx11135;zyz2011101)
藏语自动分词是藏语信息处理的基础性关键问题,而紧缩词识别是藏语分词中的重点和难点。目前公开的紧缩词识别方法都是基于规则的方法,需要词库支持。该文提出了一种基于条件随机场的紧缩词识别方法,并在此基础上实现了基于条件随机场的...
关键词:藏语自动分词  条件随机场 紧缩词识别  格助词
最大熵和条件随机场模型相融合的藏文人名识别
2
《中文信息学报》西北民族大学中国民族语言文字信息技术重点实验室;中国科学院自动化研究所模式识别国家重点实验室 加羊吉 李亚超 宗成庆 于洪志  出版年:2014
国家自然基金重点项目(61032008);西北民族大学中央高校基本科研业务费专项资金资助项目(ycx12003);模式识别国家重点实验室开放课题(201001051)
藏文人名识别是藏文信息处理领域研究的难点之一,其识别效果直接影响到藏文自动分词的精度和相关应用系统的性能,包括藏汉翻译、藏文信息检索、文本分类等。该文在分析藏文人名构成规律和特点的基础上,提出了一种最大熵和条件随机场相融...
关键词:藏文人名识别  最大熵 条件随机场
融合音节特征的最大熵藏文词性标注研究
3
《中文信息学报》西北民族大学中国民族语言文字信息技术重点实验室;中国科学院自动化研究所模式识别国家重点实验室 于洪志 李亚超 汪昆 冷本扎西  出版年:2013
国家自然科学基金资助项目(61032008,61262054)
藏文词性标注是藏文信息处理中非常重要的基础性问题,该文以最大熵模型为基本框架,根据藏文的构词特征及统计分析结果,定义并选取特征模板,研究了融合语言特征的最大熵藏文词性标注模型。实验结果表明,最大熵模型能够较好的处理藏文词...
关键词:藏文 词性标注 最大熵 形态特征  
基于KNN算法的藏文文本分类关键技术研究
4
《西北民族大学学报(自然科学版)》西北民族大学中国民族语言文字信息技术重点实验室 贾会强  出版年:2011
国家基金资助项目(2009BAH41B00)
根据藏文特点和藏语语法结构,可研究藏文文本的向量空间模型、藏文文本特征选择、藏文文本权重计算、KNN藏文文本分类算法和查全率、查准率和F值三种评价函数等藏文文本分类的关键技术.此外,通过实验比较了KNN算法和Rocchi...
关键词:KNN算法 藏文文本 特征选择  文本分类
藏语孤立词语音识别系统研究
5
《西北民族大学学报(自然科学版)》西北民族大学中国民族语言文字信息技术重点实验室 姚徐 李永宏 单广荣 于洪志  出版年:2009
国家自然科学基金项目(60773052);研究生创新项目(YCX08053)
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传...
关键词:藏语 孤立词 语音识别 DTW
藏语连续语音语料库设计与实现
6
《计算机工程与应用》西北民族大学中国民族语言文字信息技术重点实验室;北京大学中文系汉语语言学研究中心 李永宏 于洪志 孔江平  出版年:2010
国家自然科学基金No.60773052;国家教育部基金No.MZ115-78~~
以藏语夏河话为研究对象,建立了基于三音子的藏语连续语音语料库。首先收集了10万句藏语文本语料库,并根据夏河话的实际发音,进行了国际音标转写;然后总结了夏河话的三音子音联结构形式,并用藏语文本处理平台对其组合类型和在原始文...
关键词:藏语 三音子 语音库 Greed算法  
统计与规则相结合的藏文人名自动识别研究
7
《长春工程学院学报(自然科学版)》甘肃同元信息系统技术有限责任公司;西北民族大学中国民族语言文字信息技术重点实验室;周口师范学院计算机科学技术系 窦嵘 加羊吉 黄伟  出版年:2010
国家自然科学基金(60970071)
提出了一种基于统计与规则相结合的藏文人名自动识别方法。该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述。根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准...
关键词:藏文人名识别  互信息 格助词 人名词典  
融合无监督特征的藏文分词方法研究
8
《中文信息学报》西北民族大学中国民族语言文字信息技术重点实验室 李亚超 加羊吉 江静 何向真 于洪志  出版年:2017
国家社科基金青年项目(15CYY043);国家自然科学基金(61262054);甘肃省高等学校科研项目(2016B-007);甘肃省民族语言智能处理重点实验室开放基金;西北民族大学中央高校基本科研业务费专项资金(31920140064;31920150089)
藏文分词是藏文信息处理的基础性关键问题,目前基于序列标注的藏文分词方法大都采用音节位置特征和类别特征等。该文从无标注语料中抽取边界熵特征、邻接变化数特征、无监督间隔标注等无监督特征,并将之融合到基于序列标注的分词系统中。...
关键词:藏文 分词 序列标注  
基于多特征的藏文微博情感倾向性分析
9
《中文信息学报》西北民族大学中国民族语言文字信息技术重点实验室 江涛 袁斌 于洪志 加羊吉  出版年:2017
国家自然基金(61262054);西北民族大学中央专项资金资助研究生项目(Yxm2014001);国家科技支撑计划项目(2014BAK10B03);甘肃省科技重大专项项目(1203FKDA033)
中英文微博大都以单一语种来表述,而将近80%的藏文微博都是以藏汉混合文本形式呈现,若只针对藏文内容或中文内容进行情感倾向性分析会造成情感信息丢失,无法达到较好效果。根据藏文微博的表述特点,该文提出了基于多特征的情感倾向性...
关键词:藏文微博  混合文本  情感倾向 情感词  词性序列  
基于HMM的藏语拉萨话语音合成技术研究
10
《西北民族大学学报(自然科学版)》西北民族大学中国民族语言文字信息技术重点实验室 高璐 于洪志 郑文思  出版年:2011
教育部重点项目(210263);重点实验室开放课题(2010KF001)
研究基于HMM的合成系统,将其原理应用到藏语拉萨话中,完成了基于HMM的藏语拉萨话的语音合成系统,文中就合成语料库的建设,上下文语境信息标注,问题集设计等数据准备工作进行了描述.此外,在HTS2.0的开源平台下,对藏语语...
关键词:藏语 语音合成 HTS 数据准备 训练  
已选条目 检索报告 聚类工具

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心