TI中文支持网
TI专业的中文技术问题搜集分享网站

dsplib的效率问题

专家你好:

在6670板子上跑dsplib相关程序的时候出现了这样的问题:

使用浮点数矩阵拷贝函数时,1200行,14列的浮点数跑了接近7W个cycle,在文档里面查看应该是1W多个cycle,请问这是哪里配置出现了问题?

具体配置是L1D,L1P都配置为cache,L2 为Ram,输入和输出数组均在L2中。

一般在应用dsplib库的时候,除了应该注意函数说明中的相关问题外,还需要注意哪里问题,才能跑出文档中的cycle数。谢谢。

leo anand:

继续求专家解答,在6670上面跑了其他dsplib的矩阵函数,实际跑出来的cycle数和文档的cycle数相差3倍左右,测cycle用的是论坛上提供的TSCL方式。

Andy Yin1:

您好,

测试的时候循环多测几遍,第一次的测试由于cache miss会导致cycle偏大。

leo anand:

回复 Andy Yin1:

感谢您的解答 ,测cycle的时候也是多次测量,取均值的方法,测出来的结果还是偏大,是不是应用dsplib的时候需要特殊配置L1和L2 呢?

赞(0)
未经允许不得转载:TI中文支持网 » dsplib的效率问题
分享到: 更多 (0)