同時在不同的GPU上執行不同的內核

基本上我有兩個GPU，我想在它們的每一個上執行一些內核。我不希望GPU在同一個內核上工作，每個人都在做一些部分（我不知道這是否可能），以防萬一我甚至不想看到這種行爲。同時在不同的GPU上執行不同的內核

我只是想確保兩個設備都在運行。我創建了上下文，併爲它們兩個創建了命令隊列。但是我看到只有一個內核被執行，這意味着只有一個設備正在被使用。這是我做到的。。。

cl_device_id *device; 
cl_kernel *kernels; 
... 
// creating context. 
context = clCreateContext(0, num_devices, device, NULL, NULL, &error); 
... 
// creating command queues for all kernels 
for(int i = 0; i<num_kenrels; i++) 
    cmdQ[i] = clCreateCommandQueue(context, *device, 0, &error); 
... 
// enqueue kernels 
error = clEnqueueNDRangeKernel(*cmdQ, *kernels, 2, 0, glbsize, 0, 0, NULL, NULL);

我正確的方式嗎？

來源

2012-07-25 Nike

這取決於你如何實際填充你的device陣列。如果您正確初始化它，創建跨越設備的context是正確的。

不幸的是，你對內核和命令隊列有一個錯誤的想法。 A 內核是根據特定上下文的程序創建的。另一方面，隊列用於與某個設備進行通信。你想要做的是每臺設備不內核創建一個隊列：

for (int i = 0; i < num_devices; i++) 
    cmdQ[i] = clCreateCommandQueue(context, device[i], 0, &error);

現在，您可以通過相應的命令隊列排隊在不同設備上不同（或相同）的內核：

clEnqueueNDRangeKernel(cmdQ[0], kernels[0], /* ... */); 
clEnqueueNDRangeKernel(cmdQ[1], kernels[1], /* ... */);

綜上所述術語：

甲cl_context爲特定cl_platform_id創建並且是等的容器的設備的一個子集，
一個cl_program創建和建造一個cl_context及其相關設備
一個cl_kernel從cl_program萃取但只能在與該程序的上下文相關聯的裝置中使用，
一個cl_command_queue是針對特定設備創建屬於某個上下文，內存操作和內核調用被排入命令隊列並在相應的設備上執行。

來源

2012-07-25 20:39:05 matthias

同意。另外請注意，不同的實現處理跨多個設備分配工作負載不同（有時甚至阻止clEnqueueNDRangeKernel http://stackoverflow.com/questions/11562543/clenqueuendrange-blocking-on-nvidia-hardware-also-multi-gpu/11562814#comment15294577_11562814） - 在某些情況下可能性能較差。要真正在兩臺設備之間分離處理並自行控制它，您可以使用兩個上下文，每個上下文使用一個設備創建。 – Ani 2012-07-25 20:50:14

謝謝。只是一個簡單的問題，我不能使用一個clEnqueueNDRangeKernel語句來啓動這兩個內核嗎？ – Nike 2012-07-25 23:43:04

不，不是真的。但是在OpenCL程序中，如果你真的想分離邏輯，你可以調用在同一個程序中定義的其他函數。 – matthias 2012-07-26 06:29:04

同時在不同的GPU上執行不同的內核

回答

相關問題