2009-12-10 80 views
9

我似乎無法找到有關Google如何確定您的內容是否爲cloaking的任何信息。從技術角度來看,你認爲他們是如何確定這一點的?他們是否發送了googlebot以外的內容並將其與Googlebot結果進行比較?他們是否有一組人比較?或者他們可以以某種方式告訴您已經檢查過用戶代理並執行了不同的代碼路徑,因爲您在名稱中看到了「googlebot」?Google如何知道你是僞裝的?

這是關於legitimate url cloaking for seo這個問題。如果文本內容完全相同,但渲染是不同的(1995年風格的html與ajax vs. flash),真的存在隱形問題嗎?

感謝您對此發表評論。

回答

3

據我所知,谷歌是如何生成的搜索引擎結果是保密的,不斷變化的。欺騙不同的用戶代理很容易,所以他們可能會這樣做。對於Javascript,它們也可能實際呈現部分或整個頁面。 「他們是否有一組人比較?」這是令人懷疑的。谷歌的抓取策略包括this,但是如果涉及到人類,他們只會在特定情況下被調用。我甚至懷疑這一點:花費的任何人力可能都是通過調整抓取引擎來度過的。

1

Google在展示非googlebot用戶代理的同時查看您的網站。

+2

他們呢?這個其他用戶代理是否仍然將自己標識爲某種機器人?如果沒有,Google會不會太狡猾? – Thilo 2009-12-10 02:56:25

+5

請提供源代碼 – 2009-12-10 03:22:50

+0

即使不同的用戶代理也不能幫助谷歌判斷瀏覽器是否使用z-index覆蓋div來隱藏某些內容 - 這是否意味着「隱藏」? – 2009-12-10 03:23:05

1

請參閱Google Chrome comic book page 11它描述的地方(甚至比外行人的術語更好)瞭解Google工具如何繪製網頁示意圖。他們可能會使用這種或類似的技術進行Google搜索索引和斗篷檢測 - 至少對於它來說這將是另一個好用途。

alt text

+0

你能否解釋一下這個(這是關於渲染引擎的自動化測試)與斗篷檢測的關係? – Thilo 2009-12-10 03:08:11

+0

我在猜測技術可能會被重新打包,就像「瀏覽器認爲它正在顯示什麼內容」一樣,並且適用於Googlebot實際上所刮擦的內容。這與jQuery http://testswarm.com/的TestSwarm不同,但Google會爲它使用服務器場。是啊,它在那裏,但它有可行性的碎片。 – 2009-12-10 03:21:09

+0

我的解釋可能不是很清楚,但基本上我說的是,如果Google(通過Chrome)能夠創建技術來展示瀏覽器「認爲」它看到的內容與實際看到的內容之間的區別,那麼這個想法是不可行的他們還可以通過其他技術比較「思考」和「看」網絡世界。 – 2009-12-10 03:36:40

1

實際上,谷歌的許多算法都是微不足道的,遠非火箭科學。在所謂的「隱形檢測」的情況下,所有先前的猜測都是基於金錢的(除了有點諷刺意味的是,John K lol)如果你不相信我設立了一些測試點(輸入)和一些'隱形測試案例「(進一步的輸入),將您的網站提交給Google叔叔(處理),並通過僞高級的基於人類的認知相關量子認知來測試您的非假設(< - 順便說一句,我爲娛樂價值現在我嵌套圓括號真正混淆你的想法:))AKA「檢查谷歌結果,看看你是否被禁止」(輸出)。 Loop直到啓示== True(noob!)lol

1

Google確實聘用承包商(間接通過外部機構以極低的薪酬)手動審查作爲搜索結果返回的文檔,並判斷其與搜索條件,質量翻譯等。我非常懷疑這是他們檢測隱形的唯一工具,但它是其中之一。

0

一個非常簡單的測試就是比較Googlbot看到的網頁的文件大小與Google的別名用戶掃描的頁面的文件大小,看起來像普通用戶。

這將檢測大多數可疑候選人進行密切檢查。

0

他們使用curl等工具調用您的頁面,並且在沒有用戶代理的情況下構建基於頁面的哈希,然後他們構建另一個與googlebot用戶代理的哈希。這兩個哈希必須相似,他們有算法來檢查哈希值,並知道它的隱形與否

+2

從技術上講,您的回答是正確的,但最好提供回覆您提供的信息的鏈接,以提高此答案的質量。 – 2017-07-21 08:37:59

相關問題