登录    注册    忘记密码

期刊文章详细信息

从视觉到文本:图像描述生成的研究进展综述    

From Vision to Text: A Brief Survey for Image Captioning

  

文献类型:期刊文章

作  者:魏忠钰[1] 范智昊[1] 王瑞泽[2] 承怡菁[1] 赵王榕[1] 黄萱菁[3]

WEI Zhongyu;FAN Zhihao;WANG Ruize;CHENG Yijing;ZHAO Wangrong;HUANG Xuanjing(School of Data Science,Fudan University,Shanghai 200433,China;Academy for Engineering and Technology,Fudan University,Shanghai 200433,China;School of Computer Science and Technology,Fudan University,Shanghai 200433,China)

机构地区:[1]复旦大学大数据学院,上海200433 [2]复旦大学工程与应用技术研究院,上海200433 [3]复旦大学计算机科学与技术学院,上海200433

出  处:《中文信息学报》

基  金:国家自然科学基金(71991471);国家社会科学基金(20ZDA060);上海市科学技术委员会(18DZ1201000,17JC1420200)

年  份:2020

期  号:7

起止页码:19-29

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊

摘  要:近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。

关 键 词:图像描述生成  跨模态特征对齐  文献综述  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心