我正在建立一個網絡爬蟲,我試圖找出從哪裏來的網頁。我的意思是,我可以檢查域名(例如,來自阿根廷的.com.ar ar),但也有其他網站,其他域名(.com,.net)也是阿根廷人,其中一個例子是www.taringa 。淨。是阿根廷網站,但有.net域名。我如何知道網頁或網址的地理來源?
那麼我該怎麼做呢?
謝謝。
我正在建立一個網絡爬蟲,我試圖找出從哪裏來的網頁。我的意思是,我可以檢查域名(例如,來自阿根廷的.com.ar ar),但也有其他網站,其他域名(.com,.net)也是阿根廷人,其中一個例子是www.taringa 。淨。是阿根廷網站,但有.net域名。我如何知道網頁或網址的地理來源?
那麼我該怎麼做呢?
謝謝。
通過IP的地理位置。對IP地址做一個反向查詢 ,你可以得到一個地理位置 。這些 服務會花費金錢,並且將只有 在物理上告訴您服務器 託管的位置。
在域上做一個whois。它會 告訴你在哪裏的網站是 註冊。
但要記住, 沒有意義「這裏是一個網頁」。網絡沒有地理界限。我可以在加利福尼亞州聖何塞運行西班牙語網站,並在加拿大註冊域名聯繫人。您無法知道我的網站是針對智利用戶的。
您可以在命令行上使用whois查詢 - 或根據結果向whois.arin.net和whois.xxxx.xxx發出請求。如果我映射www.taringa.net到一個IP,我得到這個:
www.taringa.net. 300 IN A 190.210.132.53
和運行的whois上:
whois 190.210.132.53
給了我一個壯士斷腕的:
inetnum: 190.210.132/24
status: reallocated
owner: WIROOS SRL
ownerid: AR-WISR1-LACNIC
responsible: ALBERTO NAKAYAMA
address: GRAL MIGUEL DE AZCUENAGA, 71, 4 A
address: C1029AAA - BUENOS AIRES -
country: AR
phone: +54 011 30973059 [3059]
這通常適用於任何ip。