2010-07-11 68 views
1

我添加PDF文檔到Solr如何在Solr中查詢PDF?

curl "http://localhost:8983/solr/update/extract?literal.id=doc2&captureAttr=true&defaultField=text&fmap.div=foo_t&capture=div" -F "[email protected]" 

,我想它查詢單詞 「錯誤」

http://localhost:8983/solr/select/?q=errors&version=2.2&start=0&rows=10&indent=on

我沒有得到任何結果。

但是,如果我查詢它的單詞「java」,我會得到一個頁面(添加的PDF文本),並在可見文本中有詞「錯誤」。

P.S.我是Lucene和Solr的新成員,我不明白爲什麼不能在該pdf中搜索每個單詞。

+1

嘗試extractOnly = true查看Solr從PDF中提取的內容。 – 2010-07-11 21:36:32

回答

2

看看這個類似的問題和answer

嘗試使用分析,看看哪些字插入索引。