会议论文详细信息
文献类型:会议
作者单位:青海师范大学藏文信息研究中心
基 金:国家社会科学基金(07BYY035);973前期研究专项(项目编号:2010CB334708)
会议文献:少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集
会议名称:民族语言文字信息技术应用与多语言资源库建设研究,服务边疆地区信息化建设——2010年第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会
会议日期:20100627
会议地点:中国新疆乌鲁木齐
主办单位:中国中文信息学会;新疆大学;内蒙古大学
出版日期:20100627
语 种:中文
摘 要:为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,然后针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,并利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语语料库的多级加工。
关 键 词:藏语语料库 规范 词类 标记集 词典 分词标注
分 类 号:H214]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...