64 MB |
X_data[4*1024][4*1024] |
180416356 |
180416.356000 |
64 MB |
X_data[16*1024][1*1024] |
51162765 |
51162.765000 |
第二问题:
数据从L2传递到DDR3中比数据从DDR3传递到L2中运行周期大很多,将近后者的7倍
实验三:把L2SRAM中的数据存储到DDR3中
x_data 存储在L2SRAMZ中
y_dat存储在DDR3中
数据大小 |
存储形式 |
指令周期 |
耗时/us |
32KB |
X_data[8*1024] |
24444 |
24.444000 |
64KB |
X_data[16*1024] |
49034 |
49.034000 |
128KB |
X_data[32*1024] |
99180 |
99.180000 |
256KB |
X_data[64*1024] |
199012 |
199.012000 |
实验四:把DDR3中的数据加载到L2SRAM中
x_data 存储在DDR3中
y_data存储在L2SRAMZ中
数据大小 |
存储形式 |
指令周期 |
耗时/us |
32KB |
X_data[8*1024] |
183819 |
183.819000 |
64KB |
X_data[16*1024] |
367797 |
367.797000 |
128KB |
X_data[32*1024] |
734811 |
734.811000 |
256KB |
X_data[64*1024] |
1545851 |
1545.851000 |
Jack Dong:
测试记录与报告WORD文档,欢迎大家帮忙分析一下实验结果的正确性
Jack Dong:
测试中定义的X_data[][]与Y_data[][]均为float 类型
ZHIDAO BU:
请问你测试时,连接到开发板的,还是用是仿真环境
kai guo:
在开发板(TMS320C6678EVMLE)上测试时:
第一个问题,我发现同样多的数据,数据阵的列数越小速度越快。
第二个问题我也很困惑,我将1024*128大小的数据从L2中写入ddr3中和从ddr3中读取到L2中,后者的时间是前者的20倍左右,太夸张了,简直没法用了!同问!
再问下楼主,你传输的时候用edma还是直接memcpy?我是直接memcpy。
kai guo:
回复 kai guo:
楼主,再问一下:“定义DDR3段的时候采用.DDR3:load>>DDR3 采用load指令”,是什么意思?这样做速度提升很多,使用有没有限制?
Jack Dong:
回复 Andy Yin1:
1.C66XX的内联函数定义在哪个文件中?有没有相关的文档对每个内联函数做详细的功能解释说明?
http://www.deyisupport.com/question_answer/dsp_arm/c6000_multicore/f/53/t/31465.aspx
2.c6000的profile是不是只能用于软件仿真(simulator)无法用于开发板运行程序时?
http://www.deyisupport.com/question_answer/dsp_arm/c6000_dsp/f/32/t/31468.aspx
3.touch函数在哪个头文件中声明的?CCS5.1 中无法搜到?
http://www.deyisupport.com/question_answer/dsp_arm/c6000_multicore/f/53/t/31462.aspx