2011-05-20 89 views
3

也許這聽起來很天真,但是有一些東西甚至遠遠接近基於ajax的網站的php爬蟲?基於ajax的網站的php爬蟲?

+0

這不是PHP的,所以我不提供它作爲一個答案,但在的HtmlUnit Java是完全腳本模擬瀏覽器組件,完全與JS的支持 - 可作爲一個履帶式了。 – Piskvor 2011-05-20 11:02:26

回答

2

問題是,香草PHP不明白如何解析JavaScript,生成JavaScript環境,並與一切互動。爲了在理論上做到這一點,您必須通過C API擴展PHP並將其與JavaScript庫進行連接。這個規模很大,取決於你有多少資源。

2

不是自動爬蟲,因爲他們需要了解JavaScript代碼並需要知道發生了什麼。

他們可以做的是使用與啓用ajax的腳本相同的調用,因此您可以獲取原始數據。

但是,這意味着您需要對網頁及其調用的網址有非常好的理解,並且相當費力。

所以答案是:不,據我所知,它們不存在。