2010-10-13 47 views
1

我需要獲取網頁上的內容,並通過在cURL上閱讀它,但內容不包括JavaScript上的數據任何機構可以幫助我解決這個問題?如何獲取網頁上的內容包括JavaScript中的內容喜歡在瀏覽器上看到

+0

什麼意思是「包含Javascript數據」的意思。外部JS沒有加載的事實?或者說它沒有執行? – 2010-10-13 09:35:22

+0

是的,JS沒有加載。例如http://trailers.apple.com/trailers/independent/stone/我無法獲得查看預告片(2) – 2010-10-13 09:56:51

回答

2

不可能。內嵌JavaScript的網頁實際上是一個程序。 CURL爲您提供程序的源代碼(HTML和JavaScript),但不運行該程序。要運行頁面的嵌入式JavaScript,您需要(1)JavaScript解釋器,以及(2)頁面的文檔對象模型(DOM)。瀏覽器有這些,但PHP不。人們正在研究這些PHP版本,但開發這些是很重要的任務。如果這是你所需要的,你可以跳過PHP,而是用WebKit來編寫C++代碼。

+0

好的,非常感謝。 – 2010-10-13 10:35:24

0

您試過file_get_contents嗎?

+0

的內容是的,我已經嘗試過,但現在工作。 – 2010-10-13 09:57:47

0

是的,它是possibe你可以通過一個phantomjs瀏覽器,加載頁面 處理它的JavaScript,然後你也可以檢索動態呈現的內容。 看看這個鏈接,它可能會幫助你。

https://github.com/jonnnnyw/php-phantomjs