平台:DM6467
您好,我对VLIB中的混合高斯函数的效率有点问题,即
MixtureOfGaussiansS16()。手册中写的该算法的运行效率大约在 31.3cycles/pixel
这样估计下来处理D1图像704×576 (600MDSP 1.67ns cycle time),理论上性能是不错的。
但是目前我们实测的效果并没有这么好,DSP占用率达到了90%。我搜索了下 TI的support forums,找到了以下网址中TI的FAE回答
http://e2e.ti.com/support/dsp/davinci_digital_media_processors/f/99/t/47139.aspx#166493
里面说参考VLIB canny的例子,使用DMA并利用ping-pong buffer。
我对这个解释不是很明白,简言之就是如何能让VLIB中的算法,达到手册中所说的 效率?
Chris Meng:
在Vlib的安装包的exapmle/src下面就一个测试MixtureOfGaussiansS16的例子,请问你尝试过吗?尝试的时候是不是就单独只跑这个应用?是否能得到和文档对于的性能?我们的算法性能是指着一个函数调用的时间。