未被Google索引的頁面

據我所知，我的公司已在我們的網站上運行Google搜索。我開發了一個文檔系統，也正在被Google索引。系統中的頁面是動態生成的，因此我有www.mysite.com/doc.aspx?id=234，www.mysite.com/doc.aspx?id=236等索引。事情是，一些隨機頁面（比如www.mysite.com/doc.aspx?id=235）未被索引，原因不明。我希望在哪裏解決這個問題？有任何想法嗎？未被Google索引的頁面

來源

2011-04-04 netNewbi3

這裏是谷歌如何處理您的網站（）

discovery -> crawling -> indexing -> ranking (->feedback)

發現短，很simpliefied概要：是谷歌發現你的網站（S）的網頁的過程中，這樣可以既可以通過HTML或通過一個sitemap.xml的鏈接完成（在JavaScript的的onpage，RSS或Atom和URL飼料，...基本上任何URL谷歌能找到一些）

爬行：的谷歌抓取過程Ť他內容的發現URL的（和推新發現的網址進入發現隊列）

索引：存儲發現並檢索內容到他們的數據庫，並使其可搜索

排名：匹配通過用戶查詢索引內容並 - 如果足夠重要 - 將其作爲可見的SERP列表返回給用戶。基於點擊

反饋 /不點擊行爲，並從其他渠道（假定ISDN數據和谷歌工具欄，chrome瀏覽器報告，...），谷歌收集反饋收集有關用戶行爲上它的SERP數據（並在點擊後）。

每一步之間的質量指標（最後一步就是只是一個質量指標收集步驟）的很多。
每一步都會報告回之前的步驟。

因此，基本上即使您將所有的網址傳送到谷歌（即通過sitemap.xml），谷歌也不一定會抓取您的所有網址或索引或將它們排序爲可見。

好的，那麼低掛果實能夠獲得更多的頁面進入索引（他們至少有機會排名）？

溝通每頁只有一個URL（使用HTTP 301個重定向，規範標籤和清理網頁上的所有鏈接）
使您的網站更快（巨大沖擊）
使其更輕KB聰明（漂亮影響，主要是因爲速度更快）
將更獨特的內容放在您的網頁上。
防止重複內容
外部（從其他網站）鏈接到您的網頁（而不是總數量是重要的，但隨着時間的推移穩步增長）

PS：正如一個側面說明 - 的爬行步驟是可選的。甚至未被抓取的網址（即，如果他們被robots.txt阻止）可以獲得索引（和排名） - 但這不是很常見

來源

2011-04-05 07:22:42

非常感謝您的回答。我現在對Google的工作方式有了更好的理解！ – netNewbi3 2011-04-05 14:54:18

Afaik，如果頁面沒有鏈接到其他頁面，則頁面不會被編入索引。也許沒有一個頁面鏈接到非索引頁面？

來源

2011-04-04 11:11:07

我同意丹尼爾。你需要一個包含鏈接列表的頁面。或分頁列表鏈接頁面。

但dinamyc網址對SEO不利，最好的方式是友好的網址。看看ISAPIRewrite或路由。

我希望這對你有所幫助。

來源

2011-04-04 11:17:06

並非所有的頁面都被編入索引，索引引擎簡單地認爲一些頁面是不干預的。在我們的網站上，大約80％的網頁都被編入索引，對於這類網站來說這是非常好的，只有極少數的網站具有更高的費率。

正如丹尼爾所說，鏈接到頁面是至關重要的，否則它將不會被發現。然後該頁面必須具有對該頁面唯一的一些信息，並且最好是唯一的標題，或者可以將其分類爲重複。

來源

2011-04-04 11:26:06 Guffa

未被Google索引的頁面

回答

相關問題