登录    注册    忘记密码

期刊文章详细信息

藏语连续语音语料库设计与实现    

Design and implementation of Tibetan continuous speech corpus

  

文献类型:期刊文章

作  者:李永宏[1] 于洪志[1] 孔江平[2]

机构地区:[1]西北民族大学中国民族语言文字信息技术重点实验室,兰州730030 [2]北京大学中文系汉语语言学研究中心,北京100871

出  处:《计算机工程与应用》

基  金:国家自然科学基金No.60773052;国家教育部基金No.MZ115-78~~

年  份:2010

卷  号:46

期  号:13

起止页码:233-235

语  种:中文

收录情况:AJ、BDHX、BDHX2008、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘  要:以藏语夏河话为研究对象,建立了基于三音子的藏语连续语音语料库。首先收集了10万句藏语文本语料库,并根据夏河话的实际发音,进行了国际音标转写;然后总结了夏河话的三音子音联结构形式,并用藏语文本处理平台对其组合类型和在原始文本语料库中的频度进行了详细的统计分析;最后在语音库的语料设计中综合考虑了三音子以及类三音子的覆盖率和稀疏度,设计并完成了语料抽取算法,实现了语料自动选取。

关 键 词:藏语 三音子 语音库 Greed算法  

分 类 号:TN912.34]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心