如何使Apache Tika索引包含子目錄的PDF和文本文件的目錄並將其提交給Apache Solr,以便我可以爲此目錄的內容設置搜索引擎?如何配置Apache Tika和Apache Solr來索引和搜索pdf文件的目錄?
任何建議apprechiated,在Windows或Linux上並不重要。 我還沒有能夠得到這個工作,因爲這兩個項目的文檔主要面向開發人員,這很好,但是,我不能讓他們這樣做,因爲文檔模糊,不夠清晰, Java開發人員。
於是很乾脆:如何構建使用的項目在Apache Lucene的家庭一個搜索引擎,可以索引並提供用於/ home /材料或c搜索:/材料或/ cygdrive/C /材料
非常感謝