2011-03-09 67 views

回答

2

我們使用Swish-e爲我們的網站編制索引,其中包括成千上萬的PDF,Word文件甚至WordPerfect文件。它效果很好。它是免費的,開源的,並與PHP集成得很好。

http://swish-e.org/index.html

從他們的主頁:

沙沙-e是用於索引網頁或其他 文件 集合了快速,靈活和自由 開源系統。 Swish-e非常適合用於收集百萬份文件或 較小的 。使用GNOME™libxml2 解析器和一組過濾器, Swish-e可以索引純文本,電子郵件,PDF,HTML,XML,Microsoft® Word/PowerPoint/Excel和約 任何可以轉換爲XML 或HTML文本。 Swish-e也經常用於補充數據庫,如用於非常快速的全文搜索的MySQL®DBMS數據庫 。