登录    注册    忘记密码

期刊文章详细信息

基于CNN-RNN深度学习的图片描述方法与优化    

The Image Caption Method Based on CNN-RNN Deep Learning and It's Optimization

  

文献类型:期刊文章

作  者:陈虹君[1] 罗福强[1] 赵力衡[1] 张杰[2] 李瑶[1]

CHEN Hong jun;LUO Fu- qiang;ZHAO Li- heng;ZHANG Jie;LI Yao(School of Electronic Information,Jincheng College of Sichuan University,Chengdu 611731;Institute of hnage Research,Sichuan University,Chengdu 610207 China)

机构地区:[1]四川大学锦城学院电子信息学院,四川成都611731 [2]四川大学图像研究所,四川成都610207

出  处:《湘潭大学自然科学学报》

基  金:四川省教育厅重大培育项目(18CZ0047)

年  份:2018

卷  号:40

期  号:2

起止页码:67-70

语  种:中文

收录情况:AJ、CAS、MR、SCOPUS、ZMATH、普通刊

摘  要:为了提高模型的泛化能力,将机器翻译的编-解码模型引入图片描述中.首先,提出了CNN-RNN模型:CNN负责编码,RNN负责解码,RNN模型采用LSTM网络.接着,考虑到该模型一定程度上忽略了图片的局部区域特征和图片语义信息,因此又提出改进的CNN-MIL-DRN模型.该模型考虑了属性概率向量,并将多个时刻状态堆叠在一个时刻的计算中,加深了非线性变换的复杂深度.最后,采用MS COCO C5进行模型测试,以AP及5个不用的阈值测试不同指标,同时选取一些目前较新的模型作对比,从而得到CNN-MIL-DRN模型的最优效果.

关 键 词:神经网络 CNN RNN MIL  LSTM  DRN  

分 类 号:O152.1[数学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心