一个很简单的代码,C66x核,却要3ms。有什么好的办法把时间降下去呢?求各位大佬们给点意见,是已经开了O3,cache的。
Shine:
请问这3ms时间是怎么测出来的?
user4393958:
回复 Shine:
拿Debug下的clock测试的啊,也用TSCH,TSCL测过了。
Shine:
回复 user4393958:
请问用的是哪款器件?代码是放在哪里执行?data[i]是放在哪里的?
user114715729:
一个最简单的优化方法,temp=255/temp,尽量不做除法,固定值的话用乘法代替,会有很大的优化成果。
Thomas Yang1:
回复 user114715729:
用RCPSP指令求倒数后,再用牛顿差值,可获得最大优化,具体细节参考指令手册 RCPSP指令
user4393958:
回复 Shine:
6657,代码在L2,data在SL2的。
user4393958:
回复 Thomas Yang1:
嗯 谢谢,我回头试试
user4393958:
回复 Thomas Yang1:
嗯 我回头试试