2017-07-27 65 views
0

所有漫遊,我發現這個在我的AW統計:的preg_match規則來檢測,除了谷歌,雅虎,必應

未知機器人(緊跟着一個空格或以下字符_ +的一個「機器人」標識:,。 ;/- )

636127 + 83 GB 17.95

這是在我的網站上消耗的最大帶寬。比谷歌機器人消耗的時間多4倍。

我不知道這些機器人是,或他們所發送的交通量,但總點擊通過我的網站這個月已經越過100萬機器人,這就造成了「帶寬超過」錯誤消息

有沒有辦法阻止所有這些使用PHP preg?

但我不想阻止谷歌機器人,雅虎機器人和殭屍機器人。

有人可以給我PHP中的preg_match規則來檢測這些機器人嗎?

我想使用PHP,這樣我就可以在發送403代碼之前記錄它們的條目。

謝謝

+0

*有人可以給我preg_match規則*>你自己先嚐試了什麼? – Jer

+0

是的,我試過,但我最多能做到的是:的preg_match(「/ BOT /」,$ user_agent_string),但檢測所有的機器人,並且不排除谷歌,雅虎和Bing –

+0

大約只需使用什麼' piwik設備檢測器? https://github.com/piwik/device-detector買我喜歡躲在我的身後'CloudFlare'服務的服務器。它具有抗履帶/防火牆/ DDoS和更多的功能。 – num8er

回答

0

事實上,檢測標題不是好主意。

今天你趕上機器人怪異的名字,明天就變成Google bot做同樣的異常操作。

我使用的是CloudFlare,它保存了我的網絡應用程序/系統免受熱鏈接,攻擊,爬蟲,壞人等,緩存靜態內容,節省服務器的帶寬等等。

相關問題