cachegrind

4熱度

1回答

假設我選擇了perf事件instructions，LLC-load-misses,LLC-store-misses。進一步假設我測試一個程序prog變化它的輸入。是否valgrind應該給我相同的輸入和相同計數器的「相同」功能結果？也就是說，如果perf中的一個值上升，valgrind中的值應該始終保持不變？ valgrind是否會影響我在分析我的代碼時應該注意的模擬？編輯：BTW，之前人們燒烤

6熱度

2回答

緩存友好的方法，以將兩個矩陣相乘

我打算乘以使用緩存友好的方法2點矩陣（這將導致較少的未命中的數目）我發現，這可以與高速緩存友好轉置函數來完成。但我無法找到這個算法。我可以知道如何實現這一目標嗎？

3熱度

1回答

Cachegrind輸出解釋

這是cachegrind輸出的一部分。這部分代碼已執行1224次。 elmg1是一個無符號長數組，大小爲16 x 20。我的機器L1高速緩存大小爲32KB，64B高速緩存行大小和8路組相關聯。爲（I = 0;我< 20; i ++在）78336 2448 2 50184 0 0 1224 0 0 { telm01 = elmg1 [I]; 146,880 0 0 73,440 0 0 24,48