2009-10-30 116 views
-1

如何通過PHP獲取網站信息。如何通過PHP獲取網站信息

不使用

file_get_contents

是否有任何其他方式來獲取網站信息。

例如網址:http://www.quarkbase.com/google.com

在這個頁面中,您將獲得有關GOOGLE頁面全部信息。像這樣如果我輸入任何一個網站的URL,我需要獲得有關該網站的更多信息。

我希望查詢非常清楚。

讓我知道如果您有任何關於查詢

任何疑問

由於N使

FERO

回答

0

cURL不會解決他的問題。它可以幫助他截取網站的截圖,但是他們關於URL的信息來自大量來源。交通信息來自Alexa,他們從相關網站獲取社交網絡統計信息,以及有關運行網站的公司的任何信息,他們可以從單獨的數據庫中獲得,也可以讓員工輸入有關他們索引的較大網站的信息。

簡單地通過閱讀頁面的來源,沒有辦法辨別那種類型的信息。他們使用大量的算法搜索頁面內容的模式,他們使用Alexa的API來獲取其使用數據,他們使用社交網絡服務的API來從他們的數據中挖掘數據等。

這絕對不是一件容易的事情...

+0

Hi Braeden,你會指導我解決這個問題。因爲我是初學者,所以我需要一些專家幫助...你會嗎? – Fero 2009-10-30 05:13:14

0

因此,通過網站信息的等級?是指註冊機構和域信息?就像通過dnsstuff.com或其他有關擁有該域名的公司的元信息一樣。

自動抓取這些類型的數據可能會非常棘手。您不僅需要從幾個地方獲取這些信息,但是如果他們發現您不遵守robots.txt,那麼許多地方會阻止您。

您需要更精確地列出要收集的內容。谷歌的「dns工具」,你會發現像http://dnsstuff.com這將導致你更接近獲取這些信息。有時你必須去像networksolutins.com這樣的註冊商才能獲取信息。另外,請查看unix whois命令和unix dig命令。

+0

嗨memnoch_procy ..我不需要file_get_contents()。因爲它沒有做我想做的事......我也需要這些註冊商和域信息。是可以做到的嗎?我在那裏舉了一個例子網站。我只需要網站描述,徽標和註冊商以及域名信息。請幫我解決這個問題 – Fero 2009-10-30 05:10:19

1

您可能要檢查出的F *()函數從C

它們允許細流操作移植。

一些很好的提示here

$handle = fopen("http://www.quarkbase.com/google.com/", "r", false, $context); 
$text = ''; 
while (!feof($handle)) 
    $text .= fread($handle, 8192); 
fclose($handle);