期刊文章详细信息
基于MSER和CNN的彝文古籍文献的字符检测方法 ( EI收录)
MSER and CNN-Based Method for Character Detection in Ancient Yi Books
文献类型:期刊文章
CHEN Shanxiong;HAN Xu;LIN Xiaoyu;LIU Yu;WANG Minggui(College of Computer & Information Science, Southwest University, Chongqing 400715, China;Research Institute of Yi Nationality Studies, Guizhou University of Engineering Science, Bijie 551700, Guizhou, China)
机构地区:[1]西南大学计算机与信息科学学院,重庆400715 [2]贵州工程应用技术学院彝学研究院,贵州毕节551700
基 金:国家自然科学基金资助项目(61872299);中国博士后基金资助项目(Xm2016041);重庆市自然科学基金资助项目(cstc2019jcyj-msxm2550);模式识别国家重点实验室开放课题(201900010);西南大学中央高校基本科研业务费专项资金资助项目(XDJK2018B020);重庆市教委科研项目(KJQN201801901)。
年 份:2020
卷 号:48
期 号:6
起止页码:123-133
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CAS、CSCD、CSCD2019_2020、EI、IC、JST、PROQUEST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:彝文古籍中字符的检测是古彝文字符识别的重要基础,检测的准确性直接影响着古彝文识别的精准程度。针对彝文古籍文献版面结构复杂、排版缺乏规范、存在图文混排等情况,提出一种基于最大极值稳定区域(MSER)和卷积神经网络(CNN)的彝文古籍文献字符检测方法。首先对彝文古籍扫描图片用非局部均值滤波进行了预处理,然后采用一种改进的局部自适应二值化方法得到二值图像,实现对图像的前景和背景的分割;再采用基于启发式规则的方法对非文本区域进行去除,从而得到文本区域;最后采用MSER和CNN相结合的方法对古籍中的单个字符进行检测。实验结果表明,该方法对古籍中文本和非文本区域进行了有效的分离,并在单字符检测实验中取得了较高的准确率和召回率,能有效地解决古籍文献字符识别中的字符检测问题。
关 键 词:彝文古籍 字符检测 二值化 最大极值稳定区域 卷积神经网络
分 类 号:TP391.4]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...