2013-03-08 75 views
4

我最近改變了從當前項目中的繪圖從標準繪圖從存儲器陣列到VBO。令我驚訝的是,幀速率從60fps大幅下降到30fps,以1200verts 8次繪製模型。進一步分析顯示,與使用內存繪圖相比,使用VBO時,glDrawElements花了10倍的時間。OpenGL ES iOS繪圖性能比VBOs慢很多

我真的很困惑爲什麼會發生這種情況。有誰知道可能導致性能下降的原因是什麼?

我在運行iOS 6.1.2的iPhone 5上測試。

我已經隔離了我的VBO處理成一個函數,其中我創建頂點/索引緩衝區一次靜態在函數的頂部。我可以用#ifdef來USE_VBO正常和VBO渲染之間切換

- (void)drawDuck:(Toy*)toy reflection:(BOOL)reflection 
{ 
    ModelOBJ* model = _duck[0].model; 
    int stride = sizeof(ModelOBJ::Vertex); 

#define USE_VBO 
#ifdef USE_VBO 
    static bool vboInitialized = false; 
    static unsigned int vbo, ibo; 
    if (!vboInitialized) { 
     vboInitialized = true; 

     // Generate VBO 
     glGenBuffers(1, &vbo); 
     int numVertices = model->getNumberOfVertices(); 
     glBindBuffer(GL_ARRAY_BUFFER, vbo); 
     glBufferData(GL_ARRAY_BUFFER, stride*numVertices, model->getVertexBuffer(), GL_STATIC_DRAW); 
     glBindBuffer(GL_ARRAY_BUFFER, 0); 

     // Generate index buffer 
     glGenBuffers(1, &ibo); 
     int numIndices = model->getNumberOfIndices(); 
     glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ibo); 
     glBufferData(GL_ELEMENT_ARRAY_BUFFER, sizeof(unsigned short)*numIndices, model->getIndexBuffer(), GL_STATIC_DRAW); 
     glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, 0); 
    } 
#endif 

    [self setupDuck:toy reflection:reflection]; 


#ifdef USE_VBO 
    // Draw with VBO 
    glBindBuffer(GL_ARRAY_BUFFER, vbo); 
    glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, ibo); 

    glEnableVertexAttribArray(GC_SHADER_ATTRIB_POSITION); 
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_NORMAL); 
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_TEX_COORD); 

    glVertexAttribPointer(GC_SHADER_ATTRIB_POSITION, 3, GL_FLOAT, GL_FALSE, stride, (void*)offsetof(ModelOBJ::Vertex, position)); 
    glVertexAttribPointer(GC_SHADER_ATTRIB_TEX_COORD, 2, GL_FLOAT, GL_FALSE, stride, (void*)offsetof(ModelOBJ::Vertex, texCoord)); 
    glVertexAttribPointer(GC_SHADER_ATTRIB_NORMAL, 3, GL_FLOAT, GL_FALSE, stride, (void*)offsetof(ModelOBJ::Vertex, normal)); 
    glDrawElements(GL_TRIANGLES, model->getNumberOfIndices(), GL_UNSIGNED_SHORT, 0); 

    glBindBuffer(GL_ARRAY_BUFFER, 0); 
    glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, 0); 
#else 
    // Draw with array 
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_POSITION); 
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_NORMAL); 
    glEnableVertexAttribArray(GC_SHADER_ATTRIB_TEX_COORD); 

    glVertexAttribPointer(GC_SHADER_ATTRIB_POSITION, 3, GL_FLOAT, GL_FALSE, stride, model->getVertexBuffer()->position); 
    glVertexAttribPointer(GC_SHADER_ATTRIB_TEX_COORD, 2, GL_FLOAT, GL_FALSE, stride, model->getVertexBuffer()->texCoord); 
    glVertexAttribPointer(GC_SHADER_ATTRIB_NORMAL, 3, GL_FLOAT, GL_FALSE, stride, model->getVertexBuffer()->normal); 
    glDrawElements(GL_TRIANGLES, model->getNumberOfIndices(), GL_UNSIGNED_SHORT, model->getIndexBuffer()); 
#endif 
} 

ModelOBJ ::頂點就是3,2,3浮於POS,texcoord,正常。指數是ushort。

更新:我現在已經將繪圖設置(即attrib的綁定調用)包裝到VAO中,現在性能還可以,甚至比從主內存繪製好一些。所以我的結論是,沒有VAO的VBO支持在iOS上被破壞。這個假設是否正確?

+0

不應該model-> getVertexBuffer() - > position是&model-> getVertexBuffer() - > position? – Kimi 2013-03-08 16:48:32

+0

位置被定義爲浮動位置[3],所以這是可以的。 – Gottfried 2013-03-08 17:07:07

+1

非常有趣的是,VAO修復它!你確定你沒有在程序的其他地方有任何啓用了雜散的頂點屬性嗎?如果是這樣,那可以解釋它,因爲VAO封裝了啓用的頂點屬性集合。 – prideout 2013-03-08 22:27:48

回答

8

驅動程序可能會退回軟件頂點提交(CPU從VBO複製到命令緩衝區中)。這可能比使用客戶端內存中的頂點數組更糟糕,因爲我們通常緩存客戶端內存,而VBO內容通常在iOS上寫入組合內存。

在Instruments中使用CPU採樣器時,如果時間在gleRunVertexSubmitARM中的glDrawArrays/glDrawElements下面,您將看到噸。

迴歸SW CPU提交的最常見原因是未對齊的屬性(當前的iOS設備需要每個屬性爲4字節對齊),但是對於您所擁有的3個屬性來說,並不是這種情況所示。之後,下一個最常見的原因是在單個頂點陣列配置中混合客戶端陣列和緩衝區對象。

在這種情況下,您可能有一個零散的頂點屬性綁定:其他一些數組元素可能仍然處於啓用狀態並指向客戶端陣列,從而導致所有內容從硬件DMA路徑中脫離。通過創建一個VAO,你或者從錯誤配置的默認VAO切換,或者嘗試啓用一個客戶端VAO,但因爲客戶端數組折舊並且在與VAO一起使用時不起作用(而是拋出INVALID_OPERATION錯誤) 。

+0

謝謝,它絕對看起來像你所說的是理由,因爲配置文件匹配你所說的(在gleRunVertexSubmitARM中,低於glDrawElements的時間)。我會分析我的繪圖代碼以找到確切的原因。對齊不應該是這樣,因爲我全部都在浮動狀態,但是從前一輪的調用中產生的流浪效果肯定是可能的。 – Gottfried 2013-03-12 11:04:38

1

當您使用glBufferData填充索引緩衝區時,第二個參數應該是2*numIndices而不是stride*numIndices

由於您的索引緩衝區比需要的大得多,這可以解釋您的性能問題。

+0

好的。對不起,我在美化帖子的代碼時發生了一個錯字。我已糾正它,但這並不能解決問題。它真的讓我困惑,因爲它太慢了。我會理解性能不會改變,但這似乎是驅動程序中的一個錯誤。 – Gottfried 2013-03-08 17:03:17