SSE向量類型雙操作

-2

我想使用SIMD在AMD64架構上操作包含雙類型值的向量。下面是我的問題的簡單例子。這工作正常，如果我打印浮動值，但不是雙。我需要精確到9位十進制數字。SSE向量類型雙操作

#include<stdio.h> 
#include<emmintrin.h> 

typedef union f4vector 
{ 
    __m128d v; 
}float4; 

int main() 
{ 
float4 x,y,z; 
double f0[2]={2334, 5}; 
    double f1[2]={2334.32345324 , 5}; 
double f3[2]; 

x.v=_mm_set_pd(f0[0], f0[1]); 
y.v = _mm_set_pd(f1[0], f1[1]); 
z.v = _mm_mul_pd(x.v , y.v); 

f3[0]=z.v[0]; 
f3[1]=z.v[1]; 

printf("%d, %d\n", f3[0], f3[1]); // doesnt print correct values. 

}

來源

2017-05-05 Sarmad

的'％D'格式說明是整數。如果你不想打印浮動或雙打，使用'％f'。 – vordhosbn

除了顯而易見的錯誤，使用常量值，優化器會咀嚼這些數據並將常量傳遞給'printf'。這裏根本不會有任何SIMD操作。 –

printf中你已經使用格式說明爲％d你需要爲你想打印雙重價值

來源

2017-05-05 13:53:47 Pras

你有一些錯誤使用％F：

使用％d格式說明而不是函數printf中的％f。
要有效使用SIMD指令，必須使用矢量指令（如_mm_loadu_pd/_mm_storeu_pd）加載和存儲數據。內在_mm_set_pd是非常無效的。

下面我寫正確的示例：

#include<stdio.h> 
#include<emmintrin.h> 

int main() 
{ 
    double d0[2] = { 2334, 5 }; 
    double d1[2] = { 2334.32345324 , 5 }; 
    double d2[2] = { 0, 0 }; 

    __m128d v0 = _mm_loadu_pd(d0); 
    __m128d v1 = _mm_loadu_pd(d1); 
    __m128d v2 = _mm_mul_pd(v0, v1); 
    _mm_storeu_pd(d2, v2); 

    printf("%f, %f\n", d2[0], d2[1]); 
}

輸出：

5448310.939862, 25.000000

來源

2017-05-05 13:54:14 ErmIg

更好的是你*解釋*錯誤是什麼！ –

SSE向量類型雙操作

回答

相關問題