2012-08-15 72 views
1

字段元素數量對索引/搜索性能有什麼影響?Solr:字段元素數量對索引/搜索性能的影響是什麼?

我們有以下文檔結構,其中一些文檔具有最多400個字段元素。 我們已經看到Solr的服務器CPU使用率上去,沒有找出問題,以增加#的元素,但不知道是否有人做過any analysis on the Solr performance vs # of field elements.

我們使用的是單一的Solr服務器同時索引還讀,用自動提交啓用。

<add> 
    <doc> 
     <field name="id">User 4990</field> 
     <field name="type">User</field> 
     <field name="type">ActiveRecord::Base</field> 
     <field name="class_name">User</field> 
     <field name="id_i">4990</field> 
     <field name="login_s">someuser</field> 
     <field name="first_name_s">some</field> 
     <field name="last_name_s">user</field> 
     <field name="email_s">[email protected]</field> 
     <field name="department_s">department-psg</field> 
     <field name="activated_b">true</field> 
     <field name="private_profile_b">false</field> 
     <field name="deleted_b">false</field> 
     <field name="followers_im">4834</field> 
     <field name="followers_im">4965</field> 
     <field name="followers_im">3</field> 
     <field name="followers_im">4291</field> 

     ... 
     ... 
     .. 
     <field 
      .. 
     <**400** such fields 

    .. 
    </doc> 
</add> 

Solr的版本:3.6.1,Java 6的分上OS 5.6

回答

1

這取決於您是否正在尋找在各個領域和你所使用的運營商,存儲在字段中的數據的大小,模式中的字段是如何定義的以及您是隻在字段上搜索還是從中檢索數據以顯示。

在一般的搜索是相當快的,在我的模式中我有~100個字段。但是,存在效率低下的查詢會降低速度。有關更多詳情,請參閱the solr performance wiki

根據我自己的經驗,我可以告訴你,突出顯示受到突出顯示的字段數量的強烈影響,因爲它在每個結果文檔的每個字段上運行,即在實踐中出現大量字段會給你帶來二次複雜性。