lxml

    1熱度

    2回答

    我在Python中獲取使用請求模塊的響應,響應是xml形式。我想解析它並從每個'dt'標籤中獲取詳細信息。我無法使用lxml來做到這一點。 這裏是XML響應: <?xml version="1.0" encoding="utf-8" ?> <entry_list version="1.0"> <entry id="harsh"> <ew>harsh</ew><s

    1熱度

    2回答

    問題是關於Python的CSS選擇器。 我不能用正確的方式編寫選擇器來選擇帶有「Last」的項目。我試着用: div.pager a:[text*='Last'] 元素在決定該項目位於: <div class="pager"><a href="/search/1080p/" class="current">1</a> <a href="/search/1080p/t-23/">23</a> <

    3熱度

    1回答

    因此,我一直試圖從「2005年至2013年之間喝酒」 颳起「2005 - 2013」​​,起初這段代碼對我有用,但現在我只能得到返回的空列表,我的要求還是有200個狀態碼 import requests, lxml.html, csv headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/5

    0熱度

    1回答

    我在從我的xpath列表中刪除元素時遇到問題。 我是一個在Python和HTML刮的新手,所以忍耐着我:) 我讀過nodes.getparent().remove(nodes)應該刪除一個元素,但我甚至不能編譯它。 因此,我似乎沒有得到我需要能夠刪除的元素類型。 我可以毫無問題地撥打nodes.getparent(),但不能刪除。 Error: "TypeError: Argument 'elem

    0熱度

    1回答

    如果不需要驗證,我可以使用lxml模塊獲取網站的html。但是,如果需要的話,我如何使用python輸入'用戶名'和'密碼'?

    1熱度

    1回答

    我想提取給定網站上的所有hashtags: 例如,「我喜歡#堆溢出,因爲#人很有幫助!」 這應該將3個哈希標籤拉入表格中。 在網站上,我針對有一個#tag描述 表因此,我們可以發現這#love#標籤談到愛情 這是我的工作: #import the library used to query a website import urllib2 #specify the url

    1熱度

    2回答

    嗨,我可以將我的xml文件轉換爲熊貓數據框。但我面臨的挑戰是我沒有在正確的行中獲取記錄,可以說我們在xml中有一組標記,例如它正在重複使用。 4倍,它有多個子節點應該是我的數據框的列,現在當我想讀取XML我想要只在我的熊貓數據框中只有4行,但我得到太多與NaN行,因爲所有其他標籤躺在不同的水平上。 編輯:剛纔弄清楚了XML數據的描述/差異。提到的一個是最終編輯的XML數據 只需找出我的XML數據的

    0熱度

    2回答

    scrapy中的lxml模塊在您嘗試返回不包含'。'的內容時工作正常。字符使用text()函數,但是當它們包含'。'時如'11.14'查詢返回' - '。如何解決這個問題? 這裏是我的代碼: stock_price = hxs.xpath('//td[@id="gt1"]//text()').extract() 目標HTML看起來像這樣: <td id="gt1" class="txtl gr

    0熱度

    1回答

    我希望從here解析表格內容。但是,該表繼續分成多個頁面。我的問題是我無法解析從page 2開始的頁面,因爲url地址沒有變化。如何找到url地址存儲其他頁面的地址?我正在使用lxml和requests。

    2熱度

    1回答

    我正在讀取xliff文件並計劃檢索特定元素。我試着用打印的所有元素 from lxml import etree with open('path\to\file\.xliff', 'r',encoding = 'utf-8') as xml_file: tree = etree.parse(xml_file) root = tree.getroot() for eleme