cachegrind

    4熱度

    1回答

    假設我選擇了perf事件instructions,LLC-load-misses,LLC-store-misses。進一步假設我測試一個程序prog變化它的輸入。是否valgrind應該給我相同的輸入和相同計數器的「相同」功能結果?也就是說,如果perf中的一個值上升,valgrind中的值應該始終保持不變? valgrind是否會影響我在分析我的代碼時應該注意的模擬? 編輯:BTW,之前人們燒烤

    6熱度

    2回答

    我打算乘以使用緩存友好的方法2點矩陣(這將導致較少的未命中的數目) 我發現,這可以與高速緩存友好轉置函數來完成。 但我無法找到這個算法。我可以知道如何實現這一目標嗎?

    3熱度

    1回答

    這是cachegrind輸出的一部分。這部分代碼已執行1224次。 elmg1是一個無符號長數組,大小爲16 x 20。我的機器L1高速緩存大小爲32KB,64B高速緩存行大小和8路組相關聯。 爲(I = 0;我< 20; i ++在)78336 2448 2 50184 0 0 1224 0 0 { telm01 = elmg1 [I]; 146,880 0 0 73,440 0 0 24,48