beautifulsoup

0熱度

1回答

我正在爲包含數學常量的網頁開發Web解析器。我需要替換一些字符才能使其具有特定格式，但我不知道爲什麼如果我打印它，我似乎工作正常;但是當我打開輸出文件時，replace（）所實現的格式似乎不起作用。這是代碼 #!/usr/bin/env python3 from urllib.request import urlopen from bs4 import BeautifulSoup ur

0熱度

2回答

Web Scraping Python（BeautifulSoup，Requests）

我正在學習使用python進行網頁抓取，但無法獲得所需的結果。下面是我的代碼和輸出代碼 import bs4,requests url = "https://twitter.com/24x7chess" r = requests.get(url) soup = bs4.BeautifulSoup(r.text,"html.parser") soup.find_all("span",{"c

1熱度

1回答

使用BS4從雅虎金融

我想下面的代碼讀取從雅虎財經的歷史CSV數據讀取網址： import datetime import time from bs4 import BeautifulSoup per1 = str(int(time.mktime((datetime.datetime.today() - td(days=365)).timetuple()))) per2 = str(int(time.mkt

0熱度

1回答

如何每一件事情標籤後複製Beautifulsoup

對家庭作業的工作，我有「doc.html」文件與數據： <span class="descriptor">Title:</span> Automated Scalable Bayesian Inference via Hilbert Coresets <span class="descriptor">Title:</span> PASS-GLM: polynomial approximate s

1熱度

1回答

BeautifulSoup - 如何迭代整個html頁面來向每個頁面添加一個類

我正在使用Beautifulsoup對錶格元素進行更改。更具體地說，我正在向tbody和td元素添加一個類。這很好，但只適用於第一個匹配元素。我無法弄清楚如何迭代頁面上其餘的匹配元素。 soup = BeautifulSoup(combine_html, "html.parser") soup.find('tbody')['class'] = 'list' soup.find('td')['c

-1熱度

1回答

BeautifulSoup不全患兒find_all

我裝盤從以下HTML腳本報廢「產品技術含量的部分行」類下的div嵌套實例： <h2 class="product-tech-section-title"> Présentation de la TV SAMSUNG UE49MU9005</h2> <div class="product-tech-section-row"> <div> Désignation</

1熱度

1回答

Python Web抓取請求自動登錄不工作

我一直在嘗試使用python requests模塊在網頁上抓取網站，並且需要登錄到站點以檢索我想要的數據。我環顧四周，但不知道爲什麼它不工作。這是我到目前爲止的代碼： import requests import bs4 as bs login_url = "__withheld__" target_url = "__withheld__" login_data = { "userna

0熱度

1回答

如何用美麗的湯解析嵌套標籤？

2熱度

1回答

從網站請求完全JavaScript呈現的html源代碼，並找到所有iframe標籤

我目前正在嘗試使用硒和BeautifulSoup從網站檢索所有iframe標籤。問題是我沒有得到所有的內置頁框，因爲BS4沒有搜索到網頁內有內部html文檔，我不相信JavaScript在HTML內執行，所以可能有一些HTML元素不是得到渲染。是否有一個網絡抓取工具，可以讓我請求一個url，檢索完整的js呈現的HTML文件，然後搜索DOM並獲取與iframe匹配的所有標籤，即使在內部HTML代碼中

-1熱度

1回答

BeautifulSoup不檢索元素

我試圖從頁面中提取一個div元素。我使用「類」來識別該標籤。但它沒有檢測到div標籤。它顯示一個空列表。我附上下面的代碼的圖像。