3
我想掃描一些網站,並希望獲得所有的Java腳本文件的名稱和內容。我嘗試了與BeautifulSoup的Python請求,但無法獲取腳本細節和內容。我錯過了什麼?獲取所有的JavaScript文件名和它的內容在Python中完美
我一直在嘗試很多方法來找到,但我覺得像在黑暗中絆倒。 這是我想
import requests
from bs4 import BeautifulSoup
r = requests.get("http://www.marunadanmalayali.com/")
soup = BeautifulSoup(r.content)
我試着用beautifulSoup.I請求不能用於掃描給出具體的類名,因爲它所有的部位而異site.Identifying文件,如JavaScript本身是我的需求量的。 –
你的代碼是什麼?你可以[編輯]你的問題,並請添加[mcve]嗎?你的意思是從頁面中的所有'
您可以使用select與
script[src]
將只找到一個src腳本標記,你不」不需要打電話。獲得多次:你也可以指定
src=True
與find_all做同樣的:這都將給予你同樣的輸出:
此外,如果您使用硒,你可以使用PhantomJs進行無頭瀏覽,如果你使用硒,你根本不需要beautufulSoup,你可以直接在硒中使用相同的css選擇器:
,讓你所有的鏈接:
來源
2016-03-28 10:20:10