期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国石油大学(华东)计算机与通信工程学院,山东青岛266580 [2]江苏中科梦兰电子科技有限公司国家级企业技术中心,江苏苏州215500
基 金:江苏省工业和信息产业转型升级专项基金项目
年 份:2017
卷 号:38
期 号:12
起止页码:3361-3367
语 种:中文
收录情况:BDHX、BDHX2014、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:为提高龙芯平台的多媒体处理能力,分析龙芯处理器核GS464/GS464E的LoongSIMD指令系统,提出SIMD指令级优化方法。通过分析FFmpeg的开源H.264解码器的并行特征,结合龙芯处理器的结构并行特点,利用龙芯特有的性能计数器,解析影响性能的热点函数,采用手工嵌入龙芯SIMD和访存扩展等汇编指令的方式进行细粒度优化。实验结果表明,该方法使平均性能提高了50%,工作成果已推送到龙芯开源社区,增强了基于龙芯3A处理器的国产计算机在桌面多媒体应用领域的用户体验。
关 键 词:单指令流多数据流 龙芯3A GS464 GS464E微架构 FFmpeg多媒体库 H.264解码优化
分 类 号:TP302]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...