2011-04-10 111 views
0

我打算寫一個將從網站獲取信息的解析器。解析器問題PHP

但是,這個網站有什麼問題,只要我拿起信息並把它放在一個文件中,這都是胡言亂語。

該網站是anidb.net

誰能告訴我,爲什麼我得到亂碼,而不是HTML?

我的代碼

<?php 
$url = 'http://anidb.net/perl-bin/animedb.pl?show=anime&aid=854'; 

file_put_contents("file.txt", file_get_contents($url)); 
?> 

我還要補充一點,使用瀏覽器的查看源文件功能我看到的HTML。

+3

請指定結果; gibbrish是非常不確定的 – Zirak 2011-04-10 09:45:27

+0

你將不得不顯示胡言亂語來確認,但很可能你正在接收的內容是gzip編碼的。 – 2011-04-10 09:45:56

+0

這是它(如果你可以看到這些字符) – dikidera 2011-04-10 09:50:33

回答

5

我檢查了您指定的頁面上的頭和它的返回:

Content-Encoding: gzip 

這意味着「胡言亂語」你看到的的確是gzip的編碼。這是另一個應該幫助你的線索: Decode gzipped web page retrieved via cURL in PHP

+0

謝謝隊友,它確實是gzipped,現在我解碼它。 – dikidera 2011-04-10 09:56:53