我試圖從谷歌翻譯網站中提取span標籤內容。內容是具有id =「result_box」的翻譯結果。 當試圖打印內容時,它返回None值。如何使用Beautiful Soup提取<span>標籤內容?
請檢查圖像,here
import requests
from bs4 import BeautifulSoup
r = requests.get("https://translate.google.co.in/?rlz=1C1CHZL_enIN729IN729&um=1&ie=UTF-8&hl=en&client=tw-ob#en/fr/good%20morning")
soup = BeautifulSoup(r.content, "lxml")
spanner = soup.find(id = "result_box")
result = spanner.text
問題是請求不會執行JavaScript,因此如果您訪問您試圖取消的鏈接,您將看到類似http://imgur.com/a/lwSc5的內容。這就是爲什麼總是返回None。 – Roomm
@AnkitDev結果可能是由javascript設置的,因此當你發送request.to模擬瀏覽器時,你可以使用'selenium' http://selenium-python.readthedocs.io/ – anekix
如果你需要谷歌翻譯你應該檢查此https://ctrlq.org/code/19909-google-translate-api – Roomm