登录    注册    忘记密码

期刊文章详细信息

面向视觉数据处理与分析的解耦表示学习综述    

A review of disentangled representation learning for visual data processing and analysis

  

文献类型:期刊文章

作  者:李雅婷[1] 肖晶[1] 廖良[2] 王正[1] 陈文益[1] 王密[3]

Li Yating;Xiao Jing;Liao Liang;Wang Zheng;Chen Wenyi;Wang Mi(National Engineering Research Center for Multimedia Software,School of Computer Science,Wuhan University,Wuhan 430072,China;Digital Content and Media Sciences Research Division,National Institute of Informatics,Tokyo 101-8430,Japan;State Key Laboratory of Information Engineering in Surveying,Mapping and Remote Sensing,Wuhan University,Wuhan 430079,China)

机构地区:[1]武汉大学计算机学院国家多媒体软件工程技术研究中心,武汉430072 [2]日本国立信息学研究所数字内容和媒体科学研究部,东京101-8430,日本 [3]武汉大学测绘遥感信息工程国家重点实验室,武汉430079

出  处:《中国图象图形学报》

基  金:湖北省自然科学基金项目(2020CFA001);湖北省重点研发计划项目(2020BIB006)。

年  份:2023

卷  号:28

期  号:4

起止页码:903-934

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2023_2024、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:表示学习是机器学习研究的核心问题之一。机器学习算法的输入表征从过去主流的手工特征过渡到现在面向多媒体数据的潜在表示,使算法性能获得了巨大提升。然而,视觉数据的表示通常是高度耦合的,即输入数据的所有信息成分被编码进同一个特征空间,从而互相影响且难以区分,使得表示的可解释性不高。解耦表示学习旨在学习一种低维的可解释性抽象表示,可以识别并分离出隐藏在高维观测数据中的不同潜在变化因素。通过解耦表示学习,可以捕获到单个变化因素信息并通过相对应的潜在子空间进行控制,因此解耦表示更具有可解释性。解耦表征可用于提高样本效率和对无关干扰因素的容忍度,为数据中的复杂变化提供一种鲁棒性表示,提取的语义信息对识别分类、域适应等人工智能下游任务具有重要意义。本文首先介绍并分析解耦表示的研究现状及其因果机制,总结解耦表示的3个重要性质。然后,将解耦表示学习算法分为4类,并从数学描述、类型特点及适用范围3个方面进行归纳及对比。随后,分类总结了现有解耦表示工作中常用的损失函数、数据集及客观评估指标。最后,总结了解耦表示学习在实际问题中的各类应用,并对其未来发展进行了探讨。

关 键 词:解耦表示学习  视觉数据  潜在表征  变化因素  潜空间  

分 类 号:TP37]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心