2012-04-16 76 views
-2

我不知道我是否在問正確的問題,但我很困難。我想爲我的最後一年項目製作自己的搜索引擎。此外,我還對網絡引擎進行了一個月的研究。我遇到了nutch,lucene,solr,xapian,yaCy。但這還不夠。 我也知道我需要一個解析器,一個索引器,一個爬蟲和一個頁面排序算法,但是有很多東西需要從頭開始,我不知道從哪裏開始。如何製作搜索引擎?

我需要的是一些教程或書籍,我可以找到關於這些術語(索引器,爬蟲等)以及如何一步一步實現這些apache項目以及我應該選擇哪個apache項目。

回答

0

您需要使用solr等功能來執行搜索,然後您可以將權重應用於不同的字段,例如元標題。您需要查看部分文檔添加和更新。

您還需要一些東西來抓取網站來創建索引。你可以按照siva post中的例子。

如果您想自己編寫,可以使用python或curl網站。查找所有鏈接並啓動更多流程來收集信息。

Solr的 http://wiki.apache.org/solr/SolrInstall安裝 然後創建一個schema.xml中 http://wiki.apache.org/solr/SchemaXml - 想想哪些領域你需要,併成爲搜索等 那麼你可以使用Apache Solr實現對PHP或者多爲查詢的替代品,其是。

享受

+0

http://www.slideshare.net/teofili/apache-solr-crash-course – encodes 2012-04-16 15:29:31