专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN202010440288.X
申 请 日:20200522
申 请 人:四川无声信息技术有限公司
申请人地址:610000 四川省成都市高新区芳草东街76号
公 开 日:20230630
公 开 号:CN111612157B
代 理 人:张磊
代理机构:北京超凡宏宇专利代理事务所(特殊普通合伙)
语 种:中文
摘 要:本申请提供一种训练方法、文字识别方法、装置、存储介质及电子设备。通过多种颜色、多种文字大小、多种模糊层度以及多种文字倾斜角度的样本图像对机器学习模型进行训练,使得训练好的机器学习模型,能够适应不同样式的待识别图像,进而提高了该机器学习模型对不同场景的适应能力。
主 权 项:1.一种文字识别方法,其特征在于,应用于电子设备,所述电子设备配置有校验模型以及未训练好的机器学习模型;获取包含多种颜色、多种文字大小、多种模糊层度以及多种文字倾斜角度的样本图像,其中,每张样本图像包中,携带有特定语言种类的文字,且所述特定语言种类的文字的数量相同;通过所述样本图像,训练所述机器学习模型对所述样本图像中特定语言种类的文字进行识别,获得训练好的机器学习模型以及字典文件,所述训练好的机器学习模型依次包括携带有残差网络的卷积层、递归网络层以及转录层,所述方法包括:获取待识别图像;依次经所述携带有残差网络的卷积层、所述递归网络层以及所述转录层对所述待识别图像中特定语言种类的文字进行识别,获得各文字的文字编码;根据所述文字编码索引所述字典文件,确定出与所述文字编码对应的文字信息;隐藏所述文字信息中的部分文字,获得待校验文字信息;通过所述校验模型根据所述待校验文字信息的上下文对隐藏位置的文字进行预测,获得预测文字;将所述预测文字与所述隐藏位置的文字进行比较,对所述文字信息中不符合所述文字信息语境的文字进行修正。
关 键 词:机器学习模型 存储介质 电子设备 文字识别 样本图像 模糊层 样式 图像 场景 申请
IPC专利分类号:G06N20/00;G06V30/148;G06N3/0464;G06N3/08
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...