2009-06-11 126 views
2

爲了樣式的目的,我想在頁面上插入一些虛擬文本,但它不應該鏈接到實際內容。有沒有辦法阻止它的搜索引擎,還是我不得不使用良好的舊圖像呢?阻止某些html元素被搜索引擎索引

或者它有可能通過JavaScript動態加載它?因爲我聽說谷歌會閱讀一定數量的JavaScript。

+1

即使您屏蔽了行爲良好的搜索引擎,請注意惡意的可能會忽略或規避您放入的安全 – 2009-06-11 14:51:33

回答

0

我會非常小心,無論你決定什麼技巧。賠率是谷歌可能認爲你試圖向用戶展示不同內容的可能性。

我一直認爲Google實際上是通過渲染頁面(可能使用某些服務器端版本的Chrome渲染引擎)來工作的,然後使用OCR軟件讀取結果以確認源文本與用戶會看到JS和框架啓用。谷歌一直公開警告網站管理員不要嘗試向用戶提供不同內容的機器人,而OCR將是找出問題的最佳方式(特別是如果您的'驗證者'使用IE的用戶代理字符串並從未經Google註冊的IP範圍內抓取)。

簡短的回答那麼,服務於裝飾爲兩種:

  • 一個iframe
  • 對象
  • SVG圖像

由於您的文件中明確鏈接到您的網頁谷歌會可以認爲它是一個單獨的資源,並相應地對事物進行評分,特別是如果每​​個頁面上都顯示相同的文本。這給我帶來了:

你打算在所有/大多數頁面上使用相同的文字裝飾嗎?如果是這樣的話,谷歌幾乎肯定會把它當作「櫥窗」並忽略它(它顯然是通過菜單等來實現的)。

+0

Google當然不會使用OCR來閱讀頁面。這太荒謬了。 – 2009-07-15 09:15:14

1

你可以在無邊框iframe中顯示內容,並阻止iframe的src(一個完全獨立的「頁面」)從搜索引擎?

或者,使用javascript添加內容,將JavaScript存儲在您從引擎中阻止的.js文件中?

0

我猜想在頁面加載完成後(例如document.ready事件觸發時)加載內容將是一種相當安全的方式來完成您正在談論的內容。雖然不是100%確定的。

1

如果你通過AJAX加載文本,它可能不會被編入索引 - 上次我檢查時,GoogleBot並沒有真正執行JS(也沒有其他的蜘蛛(但有些spambots顯然可以))。

注意:AJAX響應可能應該包含一個X-Robots-Tag: noindex標頭,以防其URL實際鏈接到某處。