如何處理Whoosh中的文件？

在冒險建立一個搜索引擎，我開始與飛快。教程和基於Web的材料都很好。 Stackoverflow也有相當大的問題和答案。最初的實驗看起來很好。但我想處理位於機器各個部分的文件。我發現「從whoosh.filedb.filestore導入FileStorage」，但我正在尋找一個簡單的例子來開始。我嘗試了一些如下，它可能會給一些結果，但它會好嗎？如果有人可能請查看並更正，如果需要？如何處理Whoosh中的文件？

>>> txt_file1=open("/python27/whooshtext1.txt","r").read() 
>>> txt_file2=open("/python27/whooshtext3.txt","r").read() 
>>> writer.add_document(title=u"First document", path= unicode("indexdir"+os.sep+"a"),content=u"txt_file1") 
>>> writer.add_document(title=u"Second document", path= unicode("indexdir"+os.sep+"b"),content=u"txt_file2") 
>>> writer.commit() 
>>> with ix.searcher() as searcher: 
    query = QueryParser("content", ix.schema).parse("flood") 
     results = searcher.search(query) 
     print results 
     for result in results: 
     print result 


<Top 0 Results for Term('content', u'flood') runtime=0.000124042337439> 
>>>

來源

2015-03-31 SUBHABRATA BANERJEE

請考慮將答案標記爲已接受 – 2015-11-21 08:46:35

你應該通過文本的內容文件沒有他們的名字在writer.add_document：content=txt_file1.read()代替content=u"txt_file1"。第二個文件也一樣。

確保單詞「flood」存在於其中一個文件內。

來源

2015-04-02 07:01:03

如何處理Whoosh中的文件？

回答

相關問題