2015-03-31 45 views
2

在冒險建立一個搜索引擎,我開始與飛快。教程和基於Web的材料都很好。 Stackoverflow也有相當大的問題和答案。最初的實驗看起來很好。但我想處理位於機器各個部分的文件。我發現「從whoosh.filedb.filestore導入FileStorage」,但我正在尋找一個簡單的例子來開始。 我嘗試了一些如下,它可能會給一些結果,但它會好嗎? 如果有人可能請查看並更正,如果需要?如何處理Whoosh中的文件?

>>> txt_file1=open("/python27/whooshtext1.txt","r").read() 
>>> txt_file2=open("/python27/whooshtext3.txt","r").read() 
>>> writer.add_document(title=u"First document", path= unicode("indexdir"+os.sep+"a"),content=u"txt_file1") 
>>> writer.add_document(title=u"Second document", path= unicode("indexdir"+os.sep+"b"),content=u"txt_file2") 
>>> writer.commit() 
>>> with ix.searcher() as searcher: 
    query = QueryParser("content", ix.schema).parse("flood") 
     results = searcher.search(query) 
     print results 
     for result in results: 
     print result 


<Top 0 Results for Term('content', u'flood') runtime=0.000124042337439> 
>>> 
+0

請考慮將答案標記爲已接受 – 2015-11-21 08:46:35

回答

0

你應該通過文本的內容文件沒有他們的名字在writer.add_documentcontent=txt_file1.read()代替content=u"txt_file1"。第二個文件也一樣。

確保單詞「flood」存在於其中一個文件內。