0
我正在將SOLR中的所有文檔移至使用Pysolr使用Python代碼進行elasticsearch。將SOLR中的文檔移至elasticsearch
隨着pysolr我只能訪問499文件,它有一種方法來訪問整套文件。
我正在將SOLR中的所有文檔移至使用Pysolr使用Python代碼進行elasticsearch。將SOLR中的文檔移至elasticsearch
隨着pysolr我只能訪問499文件,它有一種方法來訪問整套文件。
這些文檔可以使用pysolr API中的偏移量和大小參數以499組的形式訪問,我在更詳細地檢查Pysolr api後發現了這一點。示例代碼如下所示:
limit = 499
offset = 0
while True:
kwargs = {'sort':'id DESC'}
response = source.search(q='projectid:774 AND source:FACEBOOK', start=offset, rows=limit, **kwargs )
print(len(response.docs))
offset = offset + limit
if len(response.docs) == 0:
break
# Do neccessary Operations
pass