在Java中開發的並行系統或分佈式系統對於網站爬蟲和web索引器更好嗎?什麼是可用的框架?使用Java的web索引器
2
A
回答
6
1
Nutch的是無與倫比的。我在項目中成功使用的另一個更簡單的lib是https://crawler.dev.java.net/。您可以在https://crawler.dev.java.net/samples.html上找到示例。
相關問題
- 1. Lucene索引 - 使用Web服務
- 2. 如何使用splunk web創建索引?
- 3. 我想使用關於Java中隨機索引的索引
- 4. 使用Java Web瀏覽器的Javascript?
- 5. 使用C#索引器時的索引安全性?
- 6. Java中的ArrayList和索引器
- 7. 對C#索引器的Java支持
- 8. 使用批量API創建索引java
- 9. 使用索引遍歷Java地圖
- 10. 啓用搜索引擎從Web應用程序索引數據
- 11. 如何使用ektorp Java API查詢索引和選擇器
- 12. Java ArrayList索引
- 13. Java的Web搜索API
- 14. 何時取消引用的Java Web MVC
- 15. Elasticsearch僅在索引有字段時使用索引過濾器
- 16. 使用索引
- 17. 在java中匹配用戶名和密碼索引的索引
- 18. 使用迭代器編制索引
- 19. Elasticsearch使用索引(分析器)只有
- 20. C#使用索引器與模板
- 21. 查詢優化器不使用索引
- 22. 使用SQLite管理器創建索引
- 23. Postgresql計劃器使用錯誤索引
- 24. 使用Java Web Start
- 25. 在Informix DB上使用索引(索引?)
- 26. 使用Rails/Postgresql索引多列索引
- 27. Java - 索引接口?
- 28. Java數組索引
- 29. Java - 倒排索引
- 30. 使用2.0 Web引用2010