2011-06-15 103 views
6

我的網站由3個主要部分組成:評論,論壇和博客。我有自動生成站點地圖的論壇和博客插件。 forum插件生成指向多個索引的站點地圖INDEX文件,博客插件生成一個包含我所有博客內容的常規站點地圖文件。以下是他們的作品從robots.txt的:在robots.txt中列出站點地圖和站點地圖索引文件?

Sitemap: http://www.datesphere.com/forum/sitemap-index.xml 
Sitemap: http://www.datesphere.com/blog/sitemap.xml 

我剛剛創建了一個包含在評論部分中的所有內容的評論sitemap.xml的文件。我正打算只需添加一行的robots.txt所以整個事情是這樣的:

Sitemap: http://www.datesphere.com/forum/sitemap-index.xml 
Sitemap: http://www.datesphere.com/blog/sitemap.xml 
Sitemap: http://www.datesphere.com/reviews-sitemap.xml 

我的問題是:我知道你可以列出的robots.txt多個站點地圖,但它是確定有站點地圖索引文件以及多個站點地圖列出?如果Googlebot在robots.txt中找到sitemap-index.xml文件,它會忽略其他站點地圖文件嗎?如果是這樣,我是否必須將我的博客和評論站點地圖放在另一個站點地圖索引文件中,並將其列入robots.txt中?

我檢查過,但只能找到問題的答案「我可以列出多個站點地圖?」

+1

老兄我認爲你應該接受你的'官方'答案:) – WonderLand 2015-11-04 02:38:34

回答

14

即使您列出了其父網站地圖索引,Googlebot也不會忽略您在robots.txt中列出的任何Sitemaps。我們幾乎遵循我們發現的每一個環節,如果我們被允許,我們會抓取它們。 個人而言,我可能只列出Sitemaps索引,儘管只是出於可管理性的考慮,但這取決於您,Googlebot不會在意您是否列出了索引和Sitemaps。

0

當你有多個站點地圖,你可以指定你的站點地圖索引文件的URL在robots.txt文件,如下面的例子:

// robots.txt 
Sitemap: http://www.example.com/sitemap_index.xml 
User-agent:* 
Disallow: /some/disallowed/path 

或者,您可以指定多個Sitemap的每個網址文件,如下例所示:

// robots.txt 
Sitemap: http://www.example.com/sitemap_host1.xml 
Sitemap: http://www.example.com/sitemap_host2.xml 
User-agent:* 
Disallow: /some/disallowed/path 

最後,這是你需要注意添加網站導航指令的robots.txt文件時要什麼。

+0

那一件事是? – Dan 2017-03-09 19:51:32

+0

@丹對不起,語法錯誤。 – slorenzo 2017-03-10 18:34:16

+0

@Sebastian,請刪除您的示例中的 用戶代理:* 禁止 ,否則複製和粘貼代碼的任何人都會告訴所有機器人不要爲您的網站建立索引。 – 2017-04-18 14:16:12