lxml

1熱度

2回答

我在Python中獲取使用請求模塊的響應，響應是xml形式。我想解析它並從每個'dt'標籤中獲取詳細信息。我無法使用lxml來做到這一點。這裏是XML響應： <?xml version="1.0" encoding="utf-8" ?> <entry_list version="1.0"> <entry id="harsh"> <ew>harsh</ew><s

1熱度

2回答

無法創建合適的CSS選擇器

問題是關於Python的CSS選擇器。我不能用正確的方式編寫選擇器來選擇帶有「Last」的項目。我試着用： div.pager a:[text*='Last'] 元素在決定該項目位於： <div class="pager"><a href="/search/1080p/" class="current">1</a> <a href="/search/1080p/t-23/">23</a> <

3熱度

1回答

python請求有時會返回空列表

因此，我一直試圖從「2005年至2013年之間喝酒」颳起「2005 - 2013」，起初這段代碼對我有用，但現在我只能得到返回的空列表，我的要求還是有200個狀態碼 import requests, lxml.html, csv headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/5

0熱度

1回答

從xpath樹中刪除元素不起作用

我在從我的xpath列表中刪除元素時遇到問題。我是一個在Python和HTML刮的新手，所以忍耐着我:) 我讀過nodes.getparent().remove(nodes)應該刪除一個元素，但我甚至不能編譯它。因此，我似乎沒有得到我需要能夠刪除的元素類型。我可以毫無問題地撥打nodes.getparent()，但不能刪除。 Error: "TypeError: Argument 'elem

0熱度

1回答

如何在網站需要驗證時使用python獲取html？

如果不需要驗證，我可以使用lxml模塊獲取網站的html。但是，如果需要的話，我如何使用python輸入'用戶名'和'密碼'？

1熱度

1回答

Hashtags python html

我想提取給定網站上的所有hashtags：例如，「我喜歡＃堆溢出，因爲＃人很有幫助！」這應該將3個哈希標籤拉入表格中。在網站上，我針對有一個#tag描述表因此，我們可以發現這#love＃標籤談到愛情這是我的工作： #import the library used to query a website import urllib2 #specify the url

1熱度

2回答

python中的XML解析熊貓在一行中獲取完整的標記塊

嗨，我可以將我的xml文件轉換爲熊貓數據框。但我面臨的挑戰是我沒有在正確的行中獲取記錄，可以說我們在xml中有一組標記，例如它正在重複使用。 4倍，它有多個子節點應該是我的數據框的列，現在當我想讀取XML我想要只在我的熊貓數據框中只有4行，但我得到太多與NaN行，因爲所有其他標籤躺在不同的水平上。編輯：剛纔弄清楚了XML數據的描述/差異。提到的一個是最終編輯的XML數據只需找出我的XML數據的

0熱度

2回答

lxml xpath path/text（）無法在'。'後返回值。出現在scrapy中

scrapy中的lxml模塊在您嘗試返回不包含'。'的內容時工作正常。字符使用text（）函數，但是當它們包含'。'時如'11.14'查詢返回' - '。如何解決這個問題？這裏是我的代碼： stock_price = hxs.xpath('//td[@id="gt1"]//text()').extract() 目標HTML看起來像這樣： <td id="gt1" class="txtl gr

0熱度

1回答

解析多個頁面而不更改url地址

我希望從here解析表格內容。但是，該表繼續分成多個頁面。我的問題是我無法解析從page 2開始的頁面，因爲url地址沒有變化。如何找到url地址存儲其他頁面的地址？我正在使用lxml和requests。

2熱度

1回答

Python -lxml xpath返回空列表

我正在讀取xliff文件並計劃檢索特定元素。我試着用打印的所有元素 from lxml import etree with open('path\to\file\.xliff', 'r',encoding = 'utf-8') as xml_file: tree = etree.parse(xml_file) root = tree.getroot() for eleme