期刊文章详细信息
文献类型:期刊文章
Bosheng LIU;Xiaoming CHEN;Yinhe HAN;Liang CHANG(School of Compuler Science and Technology,Guangdong Universily of Technology,Guangzhou 51006,China;Guangri Key Laboratory of Trusted Sofware,School of Computer Science and Information Security,Guilin University of Electronic Technology,Guilin 541004,China;State Key Laboratory of Corputer Architecture,Institute of Computing Technology,Chinese Acadery of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100190,China)
机构地区:[1]广东工业大学计算机学院,广州510006 [2]桂林电子科技大学计算机与信息安全学院广西可信软件重点实验室,桂林541004 [3]中国科学院计算技术研究所计算机体系结构国家重点实验室,北京100190 [4]中国科学院大学,北京100190
基 金:国家自然科学基金(批准号:61804155,61834006,U1811264,61966009,U1711263);广西可信软件重点实验室(批准号:kx202025)资助项目。
年 份:2021
卷 号:51
期 号:5
起止页码:795-807
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊
摘 要:光流(optical flow)为同一对象在视频中运动到下一帧的移动量.从视频中估计光流已广泛应用于各类移动智能系统,如运动估计和机器人导航.最近的研究表明,卷积神经网络(convolutional neural network,CNN)能提供可靠的光流估计结果.然而,现有的硬件加速器无法支持面向光流估计的CNN复杂计算.具体而言,这些类型的CNN不仅包括常规的卷积(convolution)和反卷积(deconvolution)运算,还包括双线性插值(bilinear interpolation)和/或关联(correlation)运算.双线性插值和关联操作主要探索两个连续图像帧之间的关联关系.为解决这一问题,本项工作提出面向光流的CNN硬件加速设计方案(称为Swan-AOE),即通过支持卷积、反卷积、双线性插值和关联操作解决这类神经网络的硬件加速计算问题.Swan-AOE包括可配置的硬件计算架构和自适应的调度策略,通过提供灵活的并行调度实现最优化吞吐量计算.此外,Swan-AOE还进行设计空间探索,探索可用片上缓存资源在提高能耗–面积效率的潜在能力.实验结果表明,与基准加速器相比,所提出的设计能有效提升性能、能效和面积效率.
关 键 词:加速器 光流估计 能效 卷积神经网络
分 类 号:TP391.41] TP183[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...