0
A
回答
1
這要看你的網站的整體排名和導入鏈接的排名,特別是如果他們沒有在您的主頁指向。
像blekko這樣的小型搜索引擎的爬蟲不會遠離外部鏈接的着陸點,除非你的整體網站很棒或者你有很多來自真棒網站的鏈接。我們爲更高級別的內容節省了我們的抓取和索引能力,因此如果我們估計頁面的排名不佳,我們就不會打擾。
即使您的鏈接配置文件只有較差的鏈接,Google的抓取工具也可能抓取相當長的一段距離 - 但即使他們知道的URL大約比實際抓取的網址多10倍。
0
如果你想抓取整個世界,然後19深度就夠了。因爲全球覆蓋了19個深度。但是如果你想抓取一個特定的領域或國家,那麼深度就足夠了。
我發現這篇文章的信息。這是用來開發墨卡託。
感謝 Mohiul阿拉姆王子
相關問題
- 1. 識別搜索引擎爬蟲
- 2. 搜索引擎沒有爬行?
- 3. 搜索引擎相關度
- 4. Python深度第一次搜索字典
- 5. 搜索引擎優化典型的iis問題決議
- 6. Django搜索引擎的溫度
- 7. 深度優先搜索確定深度
- 8. 爲垂直搜索引擎開發爬行器和刮板
- 9. AngularJS/AJAX應用程序和搜索引擎爬蟲
- 10. 搜索引擎在哪裏開始爬行?
- 11. 帶搜索引擎的PHP搜索引擎
- 12. Filshts搜索引擎
- 13. ASP.NET搜索引擎
- 14. Mysql搜索引擎
- 15. php搜索引擎
- 16. SQL搜索引擎
- 17. php搜索引擎
- 18. Django:搜索引擎
- 19. SEO - 如何避免搜索引擎爬蟲無法讀取整個網址
- 20. 搜索引擎中的倒排索引
- 21. 搜索引擎的robot.txt
- 22. vb.net中的搜索引擎
- 23. CMS的搜索引擎
- 24. AngularJS的搜索引擎
- 25. CD上的搜索引擎
- 26. GAE的搜索引擎?
- 27. 搜索引擎的功能
- 28. 搜索引擎及的iFrame
- 29. 搜索引擎的距離
- 30. 獲取搜索引擎結果中的多個文件類型
問道,「怎麼做深各大搜索引擎抓取實際?」,而不是問題「有多深,有必要爬到找到所有網頁?」這是一個有趣的說法,即需要深入10層;您提到的論文鏈接會很有幫助。 – 2012-07-18 13:42:58