也許這聽起來很天真,但是有一些東西甚至遠遠接近基於ajax的網站的php爬蟲?基於ajax的網站的php爬蟲?
3
A
回答
2
問題是,香草PHP不明白如何解析JavaScript,生成JavaScript環境,並與一切互動。爲了在理論上做到這一點,您必須通過C API擴展PHP並將其與JavaScript庫進行連接。這個規模很大,取決於你有多少資源。
2
不是自動爬蟲,因爲他們需要了解JavaScript代碼並需要知道發生了什麼。
他們可以做的是使用與啓用ajax的腳本相同的調用,因此您可以獲取原始數據。
但是,這意味着您需要對網頁及其調用的網址有非常好的理解,並且相當費力。
所以答案是:不,據我所知,它們不存在。
0
你可以使用phantomjs庫來執行js。
https://github.com/ariya/phantomjs/blob/master/examples/waitfor.js
相關問題
- 1. PHP網絡爬蟲
- 2. python網站爬蟲(多個網站)
- 3. PHP與Python對於網絡爬蟲
- 4. 單頁網頁爬蟲PHP
- 5. 讓PHP網絡爬蟲尊重任何網站的robots.txt文件
- 6. 。基於網絡的網絡爬蟲示例
- 7. 網絡爬蟲
- 8. 網絡爬蟲抓取基於AJAX的鏈接沒有瀏覽器
- 9. 反向鏈接報告網站爬蟲?
- 10. 運行一個網站爬蟲
- 11. java網絡爬蟲
- 12. Python網絡爬蟲
- 13. php爬蟲檢測
- 14. 網站爬蟲的大網站抓取網站狀態,標題和h1
- 15. 針對windows的增量爬網支持的網絡爬蟲
- 16. 需要網絡爬蟲
- 17. 自動網絡爬蟲
- 18. 網絡爬蟲,反饋?
- 19. 網絡爬蟲不打印
- 20. 網絡爬蟲應用
- 21. 網絡爬蟲提取
- 22. ajax網站(調制解調器路由器設置)中的Python爬蟲
- 23. 與ajax一起工作的網頁報廢/爬蟲
- 24. 如何測試基於Ajax的網站?
- 25. 如何爲使用oauth2的網站構建Python爬蟲
- 26. 如何檢查我的網站是否使用爬蟲訪問?
- 27. asp.net mvc網站搜索使用網絡爬蟲
- 28. 網絡爬蟲,它檢索網站源代碼
- 29. 使用DOM從外部網站選擇性提取數據PHP網絡爬蟲
- 30. 在Scala中的網絡爬蟲算法
這不是PHP的,所以我不提供它作爲一個答案,但在的HtmlUnit Java是完全腳本模擬瀏覽器組件,完全與JS的支持 - 可作爲一個履帶式了。 – Piskvor 2011-05-20 11:02:26