期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国科学技术大学计算机科学与技术学院,合肥230027 [2]安徽省计算与通信软件重点实验室,合肥230027 [3]中国科学技术大学-中国科学院沈阳计算所网络与通信联合实验室,合肥230027 [4]中国科学院计算技术研究所微处理器研究中心,北京100080
基 金:国家"核高基"重大专项课题项目(2009ZX01028-002-003-005)资助;国家自然科学基金项目(60833004)资助
年 份:2012
卷 号:33
期 号:12
起止页码:2733-2737
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:根据龙芯3B处理器特有的SIMD运算部件和指令集,在GCC编译器中实现了SIMD访存和SIMD运算的自动向量化.针对SIMD访存,给出了现有的访存方法,并详细介绍了适合龙芯3B的SIMD访存方法.对于不能自动向量化的其他SIMD运算,在GCC编译器中增加了Builtin函数的支持,用户可以根据标准函数接口调用SIMD运算函数,完成向量操作.通过对SPEC-CPU2000、DSPstone等大量benchmark的测试和分析,给出了龙芯3B SIMD运算的各项性能指数.对于性能表现不同的测试函数,均给出了详细分析数据和结论.测试表明,龙芯3B的SIMD运算在实际应用中有着良好的性能表现.
关 键 词:编译优化 SIMD 自动向量化 Builtin 龙芯3B
分 类 号:TP314]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...