把图像旋转算法放在dsp 运行 时间如下
use time: 0.182984 DSP Load : 13
use time: 0.182708 DSP Load : 15
use time: 0.183167 DSP Load : 13
use time: 0.183624 DSP Load : 15
use time: 0.179901 DSP Load : 13
use time: 0.183075 DSP Load : 15
放在 arm端,时间如下:
use time: 0.082275 DSP Load : 0
use time: 0.082215 DSP Load : 0
use time: 0.082703 DSP Load : 0
use time: 0.054474 DSP Load : 0
use time: 0.054352 DSP Load : 0
use time: 0.054992 DSP Load : 0
use time: 0.082855 DSP Load : 0
use time: 0.082764 DSP Load : 0
use time: 0.054261 DSP Load : 0
use time: 0.053742 DSP Load : 0
use time: 0.054291 DSP Load : 0
use time: 0.082519 DSP Load : 0
use time: 0.082641 DSP Load : 0
use time: 0.058533 DSP Load : 0
use time: 0.053924 DSP Load : 0
use time: 0.053711 DSP Load : 0
use time: 0.082458 DSP Load : 0
use time: 0.082306 DSP Load : 0
use time: 0.082031 DSP Load : 0
use time: 0.054291 DSP Load : 0
use time: 0.054138 DSP Load : 0
use time: 0.053864 DSP Load : 0
use time: 0.082123 DSP Load : 0
use time: 0.081971 DSP Load : 0
怎么arm还比dsp快呢,编译dsp端代码,那些-o3之类的选项 在哪个文件配置呢
谢谢
Yaoming Qin:
这个和算法是否进行针对DSP的优化有关,如果不进行针对DSP 并行优化,包括算法,编译器等的优化,效率不高是有可能的。在ccs的compilor选项里有对DSP 编译器的优化选项