专家你好:
在6670板子上跑dsplib相关程序的时候出现了这样的问题:
使用浮点数矩阵拷贝函数时,1200行,14列的浮点数跑了接近7W个cycle,在文档里面查看应该是1W多个cycle,请问这是哪里配置出现了问题?
具体配置是L1D,L1P都配置为cache,L2 为Ram,输入和输出数组均在L2中。
一般在应用dsplib库的时候,除了应该注意函数说明中的相关问题外,还需要注意哪里问题,才能跑出文档中的cycle数。谢谢。
leo anand:
继续求专家解答,在6670上面跑了其他dsplib的矩阵函数,实际跑出来的cycle数和文档的cycle数相差3倍左右,测cycle用的是论坛上提供的TSCL方式。
Andy Yin1:
您好,
测试的时候循环多测几遍,第一次的测试由于cache miss会导致cycle偏大。
leo anand:
回复 Andy Yin1:
感谢您的解答 ,测cycle的时候也是多次测量,取均值的方法,测出来的结果还是偏大,是不是应用dsplib的时候需要特殊配置L1和L2 呢?