TI中文支持网
TI专业的中文技术问题搜集分享网站

6678 矩阵相乘gemm

 工程师你好,我想问一下CPU data pack是指的是用IDMA吗 ,Linear CPU load指的是是MemCopy吗,

Shine:

请问这是哪里的图?

haotian chang:

回复 Shine:

你好 这个是Ti的关于gemm计算的文献  Level-3 BLAS on the TI C6678 multi-core DSP

Shine:

回复 haotian chang:

CPU data不是通过IDMA搬移的,IDMA搬移L1P, L1D, L2, and CFG之间的数据,可以看一下Figure 1-1 C66x CorePac Block Diagram
www.ti.com/…/sprugw0c.pdf

haotian chang:

回复 Shine:

工程师 你好,MSMC到L2那种传输方式最快,MSMC到L1那种传输方式最快,用不用cache和预取,我参考K1_STK_v1.1中的Memory—Performance中的DSP_core_Performance里面的例程函数,这块搬移都是MemCopy8实现的

赞(0)
未经允许不得转载:TI中文支持网 » 6678 矩阵相乘gemm
分享到: 更多 (0)