beautifulsoup

0熱度

1回答

我嘗試解析頁ozon.ru 解析和我有一些問題。我應該滾動頁面，然後獲取所有html代碼。但我滾動頁面，高度正在改變，但解析的結果是錯誤的，因爲它只返回第一頁的結果。我不明白，我應該更新頁面的html代碼，我該怎麼做？ def get_link_product_ozon(url): chromedriver = "chromedriver" os.environ["web

0熱度

1回答

使用BeautifulSoup解析HTML標籤

我正在解析具有許多超鏈接的網頁。能夠通過查找<a>標籤中的所有'href'來使用美麗優點提取超鏈接。接下來，我試圖獲取所有這些鏈接的「標題」，這些鏈接顯示爲標籤的標籤內容。 [HTML新手，我認爲這個尾部描述被稱爲標記內容嗎？]下面是一個例子。字符串'哪種課堂設置適合您？'需要提取。感謝幫助。 <a href="https://www.nytimes.com/video/education/100

0熱度

2回答

爲什麼我沒有獲得領域的價值而不是領域本身？

所以我想使用BeautifulSoup和Python第一次做網頁抓取。我試圖刮掉頁面是：http://vesselregister.dnvgl.com/VesselRegister/vesseldetails.html?vesselid=34172 client = request('http://vesselregister.dnvgl.com/VesselRegister/vesseldeta

-1熱度

3回答

BeautifulSoup與空間

隨着BeautifulSoul和Python類，我想find_all所有tr項目匹配包含多個名字，像一個給定的類屬性這一個： <tr class="admin-bookings-table-row bookings-history-row paid "> 我曾嘗試多種方法來匹配類。正則表達式，通配符，但我總是得到一個空的列表。有什麼方法可以使用正則表達式，通配符或如何匹配這個類？發佈了相同

1熱度

1回答

如何使用BeautifulSoup（Python）排除元素

我試圖從本文中提取文章文本（https://www.vanityfair.com/style/society/2014/06/monica-lewinsky-humiliation-culture）並排除底部的合法容器。文本部分看起來很容易，但似乎無法擺脫容器。我已將它與法律變量分開以便於使用。這裏是我到目前爲止的代碼： import requests from bs4 import Beau

0熱度

1回答

使用BeautifulSoup在CData內部擦除變量

我有一個網頁，其中包含以下數據，我想在該網頁的CData部分中進行刮擦。 <script type="text/javascript">//<![CDATA[ car.app = {"lat":26.175625,"lon":-80.13808,"zoom":"13","yellow":"\/img\/icons\/yellow.png","cars":[{"CAR_ID":"71538

1熱度

3回答

嘗試用soup.select提取URL和soup.find_all

這是一個網頁的HTML源代碼的一部分： <a href="http://www.abcde.com"> <img style="width:100%" src="/FileUploads/B/763846f.jpg" alt="search" title="search" /></a> <a id="parts_img01" href="/Result?s=9&type=%E4&

0熱度

2回答

如何計算2個預定義單詞之間的單詞數量？

<replace-add>，我不知道你知道導致</replace-add>我可以幫你<replace-del>說哦</replace-del><replace-add>我們</replace-add>感謝，所以我剛剛從</replace-add>我的女兒<replace-del> tenah代爾</replace-del><replace-add>明確可怕</replace-add> 建立一個騎

0熱度

1回答

從第行取得工具提示

我試圖從表格行取得工具提示，但它返回無。請看看我的代碼，我爲此嘗試。 <tr onmouseover="this.originalstyle=this.style.backgroundColor;this.style.backgroundColor='DodgerBlue';this.originalcolor=this.style.color;this.style.color='White';

1熱度

1回答

Python Web Scraping用captcha登錄

我必須使用網頁抓取登錄網頁，但它也需要解決驗證碼。我能夠解決驗證碼。我有問題持續會議。 session = requests.Session() html = session.get(url).content soup = bs(html, 'html.parser') name = soup.find('input', attrs={'id':some_id1}) pass = soup