beautifulsoup

    0熱度

    1回答

    我嘗試解析頁ozon.ru 解析和我有一些問題。 我應該滾動頁面,然後獲取所有html代碼。 但我滾動頁面,高度正在改變,但解析的結果是錯誤的,因爲它只返回第一頁的結果。 我不明白,我應該更新頁面的html代碼,我該怎麼做? def get_link_product_ozon(url): chromedriver = "chromedriver" os.environ["web

    0熱度

    1回答

    我正在解析具有許多超鏈接的網頁。能夠通過查找<a>標籤中的所有'href'來使用美麗優點提取超鏈接。接下來,我試圖獲取所有這些鏈接的「標題」,這些鏈接顯示爲標籤的標籤內容。 [HTML新手,我認爲這個尾部描述被稱爲標記內容嗎?]下面是一個例子。字符串'哪種課堂設置適合您?'需要提取。感謝幫助。 <a href="https://www.nytimes.com/video/education/100

    0熱度

    2回答

    所以我想使用BeautifulSoup和Python第一次做網頁抓取。我試圖刮掉頁面是:http://vesselregister.dnvgl.com/VesselRegister/vesseldetails.html?vesselid=34172 client = request('http://vesselregister.dnvgl.com/VesselRegister/vesseldeta

    -1熱度

    3回答

    隨着BeautifulSoul和Python類,我想find_all所有tr項目匹配包含多個名字,像一個給定的類屬性這一個: <tr class="admin-bookings-table-row bookings-history-row paid "> 我曾嘗試多種方法來匹配類。正則表達式,通配符,但我總是得到一個空的列表。 有什麼方法可以使用正則表達式,通配符或如何匹配這個類? 發佈了相同

    1熱度

    1回答

    我試圖從本文中提取文章文本(https://www.vanityfair.com/style/society/2014/06/monica-lewinsky-humiliation-culture)並排除底部的合法容器。文本部分看起來很容易,但似乎無法擺脫容器。我已將它與法律變量分開以便於使用。 這裏是我到目前爲止的代碼: import requests from bs4 import Beau

    0熱度

    1回答

    我有一個網頁,其中包含以下數據,我想在該網頁的CData部分中進行刮擦。 <script type="text/javascript">//<![CDATA[ car.app = {"lat":26.175625,"lon":-80.13808,"zoom":"13","yellow":"\/img\/icons\/yellow.png","cars":[{"CAR_ID":"71538

    1熱度

    3回答

    這是一個網頁的HTML源代碼的一部分: <a href="http://www.abcde.com"> <img style="width:100%" src="/FileUploads/B/763846f.jpg" alt="search" title="search" /></a> <a id="parts_img01" href="/Result?s=9&type=%E4&

    0熱度

    2回答

    <replace-add>,我不知道你知道導致</replace-add>我可以幫你<replace-del>說哦</replace-del><replace-add>我們</replace-add>感謝,所以我剛剛從</replace-add>我的女兒<replace-del> tenah代爾</replace-del><replace-add>明確可怕</replace-add> 建立一個騎

    0熱度

    1回答

    我試圖從表格行取得工具提示,但它返回無。 請看看我的代碼,我爲此嘗試。 <tr onmouseover="this.originalstyle=this.style.backgroundColor;this.style.backgroundColor='DodgerBlue';this.originalcolor=this.style.color;this.style.color='White';

    1熱度

    1回答

    我必須使用網頁抓取登錄網頁,但它也需要解決驗證碼。我能夠解決驗證碼。我有問題持續會議。 session = requests.Session() html = session.get(url).content soup = bs(html, 'html.parser') name = soup.find('input', attrs={'id':some_id1}) pass = soup