期刊文章详细信息
多语种eml文件编码及语种识别算法研究
The Research of Recognition Algorithms Based on Multi-language EML File-coding and Language Identification
文献类型:期刊文章
机构地区:[1]新疆虹联软件有限责任公司,新疆乌鲁木齐830002 [2]新疆维吾尔自治区国家安全局,新疆乌鲁木齐830002 [3]新疆维吾尔自治区经济和信息化委员会,新疆乌鲁木齐830002 [4]新疆大学信息科学与工程学院,新疆乌鲁木齐830046
基 金:2009年新疆维吾尔自治区高技术研究项目(项目号:200912117)
年 份:2010
卷 号:27
期 号:4
起止页码:482-485
语 种:中文
收录情况:CAS、MR、RCCSE、ZGKJHX、ZMATH、普通刊
摘 要:Eml文件是当前流行的邮件正文格式之一,国内国际对汉、英、俄语种的识别和研究技术已比较成熟,但维吾尔语、哈萨克语及阿拉伯语研究还处于起步阶段.本文研究了包含汉、维、哈、阿拉伯、俄、英文六个语种的eml文件编码格式及编码获取算法,尤其是采用维吾尔语、哈萨克语及阿拉伯语书写的的eml邮件,正确解析邮件头信息和正文内容,实现了对eml文件的语种精确识别.
关 键 词:EML 编码识别 多语种 语种识别
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...