2010-05-04 112 views
0

我想從HTTP流式傳輸的互聯網廣播中提取信息字符串。我的意思是關於當前播放的歌曲,樂隊名稱等的短信。從http實時流解析元數據

最好我想用python來做。到目前爲止,我已經嘗試打開一個插座,但是從那裏我得到任何提示

回答

1

聽起來像是你可能在你面前需要一些墊腳石項目一堆,我無法分析二進制數據的...

感謝爲此準備好了。沒有理由對HTTP使用低級套接字庫。命令行工具和像urlopen2這樣的Python標準庫模塊都有很好的工具,可以爲您處理低級別的TCP和HTTP細節。

您是否知道數據所在的URL?你是否在命令行上嘗試了一些簡單的命令,例如使用cURL獲取原始HTML,然後使用一些基本工具(如grep)來搜索所需的信息?我在這裏假設元數據實際上是以HTML的形式提供的,而不是通過無線電流傳輸器直接讀取的二進制格式(推測這可能是閃存也許是?)。

很難給你任何細節,因爲你的問題不包括任何關於你的數據源的技術細節。

+0

現在我意識到我並不是真的具體。我在Python中使用了urlopen,在過去實現了幾個webcrawlers和類似的東西。但我在這裏討論的來源不是一個普通的HTTP網站。這是一個HTTP直播流,基本上可以在互聯網上收聽。他們可能會流式傳輸mp3或類似的東西,通過HTTP分成大塊。 網址是http://82.134.68.82:8666 當你在說VideoLan播放器播放流時,它以某種方式提取字符串元數據,他們在哪裏編寫當前歌曲,樂隊名稱,收音機名稱等。它是大約有幾百個字符。 謝謝:) – supo 2010-05-08 10:47:29

+0

現在我嘗試通過web瀏覽器訪問網址,只是爲了它的樂趣。它顯示了一些基本信息,以及歌曲名稱!這看起來像我需要的東西..它可能是更通用的解析它從流中,但它可能會與Shoutcast以外的其他渠道。所以任何提示仍然讚賞。 – supo 2010-05-08 10:51:14

+0

返回的HTTP內容類型標題是什麼?該IP不允許我在此時連接。您可能想嘗試使用firefox Live HTTP標頭插件查看HTTP標頭,或者通過telnet連接到該端口並輸入手動HTTP GET/HTTP/1.0類型請求。 – 2010-05-08 19:47:08