|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:随着SIMD( Single Instruction Multiple Data stream)结构DSP(Digital Signal Processor)片上集成了越来越多的处理单元,并行访存的灵活性及带宽效率对实际运算性能的影响越来越大.本文详细分析了一般SIMD结构DSP中基2 FFT(Fast Fourier 'Transform)并行算法面临的访存问题,采用简单的部分地址异或逻辑完成SIMD并行访存地址转换,实现了FFT运算的无冲突SIMD并行访存;提出了几种带特殊混洗模式的向量访存指令,可完全消除SIMD结构下基2FFT运算时需要的额外混洗指令操作.最后将其应用于某1l6路SIMD数字信号处理器YHFT-Matrix2中向量存储器 VM的优化设计.测试结果表明,采用该SIMD并行存储结构优化的VM以增加18%的硬件开销实现了FFT运算全流水无冲突并行访存和100%并行访存带宽利用率;相比优化前的设计,不同点数FFT运算可获得1.32 ~2.66的加速比.
( q8 m; }# F' X关键词:快速傅里叶变换;单指令多数据流;低位交叉﹔并行存储;访问冲突;数据混洗
6 x# R9 H& ^- Z$ c W! s0 ~& R! j3 n3 y& Z9 G3 q+ I
m4 t2 U3 M2 ^0 c' s9 S
|
|