期刊文章详细信息
文献类型:期刊文章
WEI Zhongyu;FAN Zhihao;WANG Ruize;CHENG Yijing;ZHAO Wangrong;HUANG Xuanjing(School of Data Science,Fudan University,Shanghai 200433,China;Academy for Engineering and Technology,Fudan University,Shanghai 200433,China;School of Computer Science and Technology,Fudan University,Shanghai 200433,China)
机构地区:[1]复旦大学大数据学院,上海200433 [2]复旦大学工程与应用技术研究院,上海200433 [3]复旦大学计算机科学与技术学院,上海200433
基 金:国家自然科学基金(71991471);国家社会科学基金(20ZDA060);上海市科学技术委员会(18DZ1201000,17JC1420200)
年 份:2020
期 号:7
起止页码:19-29
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、JST、RCCSE、ZGKJHX、核心刊
摘 要:近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
关 键 词:图像描述生成 跨模态特征对齐 文献综述
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...