2011-04-04 83 views
0

據我所知,我的公司已在我們的網站上運行Google搜索。我開發了一個文檔系統,也正在被Google索引。系統中的頁面是動態生成的,因此我有www.mysite.com/doc.aspx?id=234,www.mysite.com/doc.aspx?id=236等索引。事情是,一些隨機頁面(比如www.mysite.com/doc.aspx?id=235)未被索引,原因不明。我希望在哪裏解決這個問題?有任何想法嗎?未被Google索引的頁面

回答

5

這裏是谷歌如何處理您的網站()

discovery -> crawling -> indexing -> ranking (->feedback) 

發現短,很simpliefied概要: 是谷歌發現你的網站(S)的網頁的過程中,這樣可以既可以通過HTML或通過一個sitemap.xml的鏈接完成(在JavaScript的的onpage,RSS或Atom和URL飼料,...基本上任何URL谷歌能找到一些)

爬行: 的谷歌抓取過程Ť他內容的發現URL的(和推新發現的網址進入發現隊列)

索引: 存儲發現並檢索內容到他們的數據庫,並使其可搜索

排名: 匹配通過用戶查詢索引內容並 - 如果足夠重要 - 將其作爲可見的SERP列表返回給用戶。基於點擊

反饋 /不點擊行爲,並從其他渠道(假定ISDN數據和谷歌工具欄,chrome瀏覽器報告,...),谷歌收集反饋收集有關用戶行爲上它的SERP數據(並在點擊後)。

  • 每一步之間的質量指標(最後一步就是 只是一個質量指標收集 步驟)的很多 。
  • 每一步都會報告回 之前的步驟。

因此,基本上即使您將所有的網址傳送到谷歌(即通過sitemap.xml),谷歌也不一定會抓取您的所有網址或索引或將它們排序爲可見。

好的,那麼低掛果實能夠獲得更多的頁面進入索引(​​他們至少有機會排名)?

  • 溝通每頁只有一個URL(使用HTTP 301個重定向,規範標籤和清理網頁上的所有鏈接)
  • 使您的網站更快(巨大沖擊)
  • 使其更輕KB聰明(漂亮影響,主要是因爲速度更快)
  • 將更獨特的內容放在您的網頁上。
  • 防止重複內容
  • 外部(從其他網站)鏈接到您的網頁(而不是總數量是重要的,但隨着時間的推移穩步增長)

PS:正如一個側面說明 - 的爬行步驟是可選的。甚至未被抓取的網址(即,如果他們被robots.txt阻止)可以獲得索引(和排名) - 但這不是很常見

+0

非常感謝您的回答。我現在對Google的工作方式有了更好的理解! – netNewbi3 2011-04-05 14:54:18

0

Afaik,如果頁面沒有鏈接到其他頁面,則頁面不會被編入索引。也許沒有一個頁面鏈接到非索引頁面?

0

我同意丹尼爾。你需要一個包含鏈接列表的頁面。或分頁列表鏈接頁面。

但dinamyc網址對SEO不利,最好的方式是友好的網址。看看ISAPIRewrite或路由。

我希望這對你有所幫助。

0

並非所有的頁面都被編入索引,索引引擎簡單地認爲一些頁面是不干預的。在我們的網站上,大約80%的網頁都被編入索引,對於這類網站來說這是非常好的,只有極少數的網站具有更高的費率。

正如丹尼爾所說,鏈接到頁面是至關重要的,否則它將不會被發現。然後該頁面必須具有對該頁面唯一的一些信息,並且最好是唯一的標題,或者可以將其分類爲重複。

相關問題