beautifulsoup

    0熱度

    1回答

    我正在爲包含數學常量的網頁開發Web解析器。我需要替換一些字符才能使其具有特定格式,但我不知道爲什麼如果我打印它,我似乎工作正常;但是當我打開輸出文件時,replace()所實現的格式似乎不起作用。 這是代碼 #!/usr/bin/env python3 from urllib.request import urlopen from bs4 import BeautifulSoup ur

    0熱度

    2回答

    我正在學習使用python進行網頁抓取,但無法獲得所需的結果。下面是我的代碼和輸出 代碼 import bs4,requests url = "https://twitter.com/24x7chess" r = requests.get(url) soup = bs4.BeautifulSoup(r.text,"html.parser") soup.find_all("span",{"c

    1熱度

    1回答

    我想下面的代碼讀取從雅虎財經的歷史CSV數據讀取網址: import datetime import time from bs4 import BeautifulSoup per1 = str(int(time.mktime((datetime.datetime.today() - td(days=365)).timetuple()))) per2 = str(int(time.mkt

    0熱度

    1回答

    對家庭作業的工作,我有「doc.html」文件與數據: <span class="descriptor">Title:</span> Automated Scalable Bayesian Inference via Hilbert Coresets <span class="descriptor">Title:</span> PASS-GLM: polynomial approximate s

    1熱度

    1回答

    我正在使用Beautifulsoup對錶格元素進行更改。更具體地說,我正在向tbody和td元素添加一個類。這很好,但只適用於第一個匹配元素。我無法弄清楚如何迭代頁面上其餘的匹配元素。 soup = BeautifulSoup(combine_html, "html.parser") soup.find('tbody')['class'] = 'list' soup.find('td')['c

    -1熱度

    1回答

    我裝盤從以下HTML腳本報廢「產品技術含量的部分行」類下的div嵌套實例: <h2 class="product-tech-section-title"> Présentation de la TV SAMSUNG UE49MU9005</h2> <div class="product-tech-section-row"> <div> Désignation</

    1熱度

    1回答

    我一直在嘗試使用python requests模塊在網頁上抓取網站,並且需要登錄到站點以檢索我想要的數據。我環顧四周,但不知道爲什麼它不工作。這是我到目前爲止的代碼: import requests import bs4 as bs login_url = "__withheld__" target_url = "__withheld__" login_data = { "userna

    0熱度

    1回答

    <div class="t m0 x1c h4 y10f ff2 fs2 fc0 sc0 ls0 ws0"> Kne e <span class="_ _72"> </span> <span class="ff3"> 102.2° <span class="_ _8"> </span>

    2熱度

    1回答

    我目前正在嘗試使用硒和BeautifulSoup從網站檢索所有iframe標籤。問題是我沒有得到所有的內置頁框,因爲BS4沒有搜索到網頁內有內部html文檔,我不相信JavaScript在HTML內執行,所以可能有一些HTML元素不是得到渲染。是否有一個網絡抓取工具,可以讓我請求一個url,檢索完整的js呈現的HTML文件,然後搜索DOM並獲取與iframe匹配的所有標籤,即使在內部HTML代碼中

    -1熱度

    1回答

    我試圖從頁面中提取一個div元素。我使用「類」來識別該標籤。但它沒有檢測到div標籤。它顯示一個空列表。我附上下面的代碼的圖像。