就这一小段代码,使用的内存都是外部内存, 当运算规模从96 * 72 变成128*128时, 理论上耗时应该变成原来的2.4倍左右, 但实际耗时就变成了原来的7,8倍,耗时为 783703(cycles), 这是什么原因导致的?求解, 谢谢?
Chris Meng:
Dong,
你分配的cache空间有多大?该问题,是否和cache有关?
就这一小段代码,使用的内存都是外部内存, 当运算规模从96 * 72 变成128*128时, 理论上耗时应该变成原来的2.4倍左右, 但实际耗时就变成了原来的7,8倍,耗时为 783703(cycles), 这是什么原因导致的?求解, 谢谢?
Dong,
你分配的cache空间有多大?该问题,是否和cache有关?