C6678 32位浮点1024 FFT和64位浮点1024 FFT的时间是多少啊?
能有多少差别?
anqiang ren1:
能有人帮我解答吗? 谢谢~!
King Wang1:
你好:
浮点的FFT在dsplib里面可以找到,您可以下载之后根据说明Run进行测试得到lib的性能。
dsplib的链接如下:
http://www.ti.com/tool/sprc265
谢谢!
anqiang ren1:
回复 King Wang1:
您好:
我按照dsplib下FFT例子 DSPF_sp_fftSPxSP_66_LE_ELF 测试的结果如下:
[C66xx_8] t_overhead: 155 DSPF_sp_fftSPxSP Iter#: 1 Intrinsic Successful SA SuccessfulN = 8radix = 2 natC: 2980optC: 1239SA: 441
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 2 Intrinsic Successful SA SuccessfulN = 16radix = 4 natC: 4529optC: 2395SA: 872
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 3 Intrinsic Successful SA SuccessfulN = 32radix = 2 natC: 12190optC: 6682SA: 2340
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 4 Intrinsic Successful SA SuccessfulN = 64radix = 4 natC: 22203optC: 13969SA: 4907
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 5 Intrinsic Successful SA SuccessfulN = 128radix = 2 natC: 59970optC: 35952SA: 12618
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 6 Intrinsic Successful SA SuccessfulN = 256radix = 4 natC: 114680 optC: 75131SA: 26452
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 7 Intrinsic Successful SA SuccessfulN = 512radix = 2 natC: 294478 optC: 182669 SA: 64284
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 8 Intrinsic Successful SA SuccessfulN = 1024 radix = 4 natC: 571082 optC: 379385 SA: 133799
[C66xx_8] Memory: 1184 bytes
[C66xx_8] Cycles: 12618 (N=128) 26452 (N=256)
请问这是正确的吗? 1024点的三种时间分别说明了什么意思呢? 这个时间好像挺大的. 求解 。。
Ryan KU:
回复 anqiang ren1:
anqiang ren 您好:
我对CCS中带的例程测得的结果也有疑问,觉得浮点情况下时间开销过大,不知道你现在有测出的结果可以共享没
类似提问见
www.deyisupport.com/…/6927.aspx
望共同探讨,共同进步
谢谢!
Ryan KU:
回复 anqiang ren1:
anqiang ren 您好:
我对CCS中带的例程测得的结果也有疑问,觉得浮点情况下时间开销过大,不知道你现在有测出的结果可以共享没
类似提问见
www.deyisupport.com/…/6927.aspx
望共同探讨,共同进步
谢谢!
anqiang ren1:
回复 Ryan KU:
[C66xx_8] t_overhead: 155 DSPF_sp_fftSPxSP Iter#: 1 Intrinsic Successful SA Successful N = 8 radix = 2 natC: 2980 optC: 1239 SA: 441
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 2 Intrinsic Successful SA Successful N = 16 radix = 4 natC: 4529 optC: 2395 SA: 872
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 3 Intrinsic Successful SA Successful N = 32 radix = 2 natC: 12190 optC: 6682 SA: 2340
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 4 Intrinsic Successful SA Successful N = 64 radix = 4 natC: 22203 optC: 13969 SA: 4907
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 5 Intrinsic Successful SA Successful N = 128 radix = 2 natC: 59970 optC: 35952 SA: 12618
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 6 Intrinsic Successful SA Successful N = 256 radix = 4 natC: 114680 optC: 75131 SA: 26452
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 7 Intrinsic Successful SA Successful N = 512 radix = 2 natC: 294478 optC: 182669 SA: 64284
[C66xx_8] t_overhead: 135 DSPF_sp_fftSPxSP Iter#: 8 Intrinsic Successful SA Successful N = 1024 radix = 4 natC: 571082 optC: 379385 SA: 133799
[C66xx_8] Memory: 1184 bytes
[C66xx_8] Cycles: 12618 (N=128) 26452 (N=256)
我的结果是这样的。。。我也没明白 。。 搞明白共享下 谢谢~!
Ryan KU:
回复 anqiang ren1:
anqiang ren 你好:
natC是一般条件下的测量值;optC是经过优化后的所以时间短些;SA是汇编条件下的测量值,效率最高。
但是我觉得6678这个时间花销太大了。
PS:请问你是怎样Enable clock的呢,我debug后显示为0,说是clock未使能,后来用TSCL测得数据的。
谢谢!
Ryan KU:
回复 anqiang ren1:
anqiang ren 你好:
natC是一般条件下的测量值;optC是经过优化后的所以时间短些;SA是汇编条件下的测量值,效率最高。
但是我觉得6678这个时间花销太大了。
PS:请问你是怎样Enable clock的呢,我debug后显示为0,说是clock未使能,后来用TSCL测得数据的。
谢谢!