lxml

    1熱度

    2回答

    我有一類網站的文字內容的多個div看起來像這樣一個div的所有內容解析爲1元的列表,而不是多個: <div class="text"> "test1" <br> "test2" <br> "test3" <br> </div> 當我使用下面的代碼來獲取這些div中的文本,最後我列出了3個單獨的元素,當我真的只想在每個div的列表中添加1個元素時。 mytext = tree.xp

    0熱度

    1回答

    從下面的html元素如何選擇,以保持文本hi there!!和使用CSS選擇放棄其他文本Cat丟棄來自某些要素的休息嗎?此外,使用.text或.text.strip()我沒有得到結果,但是當我使用.text_content()我得到的文本。 from lxml.html import fromstring html=""" <div id="item_type" data-attribute

    0熱度

    2回答

    我試圖運行在命令提示符下的命令 - pip install -r requirements.txt 但它顯示了許多錯誤,我不知道如何解決這些問題作爲我不是熟悉python。 的錯誤是: 1. Collecting lxml==3.5.0 (from -r requirements.txt (line 1)) Using cached lxml-3.5.0.tar.gz Collec

    0熱度

    2回答

    我嘗試使用Schematron驗證文檔。我使用schema for ISOSTS standard。 from lxml import etree from lxml.isoschematron import Schematron def validate(self, filename: str): file = open(filename) schema_filen

    0熱度

    1回答

    我試圖讓下面的網站的以下元素:https://www.investing.com/economic-calendar/ 我使用python的請求,並lxml.html: import requests import lxml.html payload= { 'country[]': [25,32], 'limit_from': 0, 'submitFilters': 1, 'time

    0熱度

    3回答

    安裝從requirement.txt依賴我創建了一個名爲錯誤的virtualenv,並試圖從requirements.txt文件安裝模塊使用 - PIP3安裝-r requirements.txt 在安裝使用上述命令的模塊我收到以下錯誤。我正在使用Python3並試圖安裝coala-quickstart的依賴關係。以下是終端在從requirements.txt安裝模塊時給出的消息。 Collect

    0熱度

    2回答

    正如mzjn所提示的,我正在改變整個問題並試圖簡化它。 我有這樣的XML: <Content Version="1.0" Name="Cont"> <Element Ref="Text_4158" ElementType="ItISSomething" GroupName="Some_Content"> <body> <p>Some content is here.</p>

    3熱度

    2回答

    我正嘗試使用HTMLQuestion數據結構和boto3的create_hit函數來構建XML以提交給Amazon的Mechanical Turks服務。根據文檔,XML應格式化爲like this。 我創建了一個TurkTaskAssembler類,該類具有用於生成XML並通過API將此XML傳遞到Mechanical Turks平臺的方法。我使用boto3庫來處理與亞馬遜的溝通。 似乎是我生成

    0熱度

    1回答

    我想獲取總資產數據,但返回包含總資產的所有數據。 如何才能獲取總資產數據? from lxml import html import requests page_inv_n = requests.get('http://quotes.wsj.com/MY/XKLS/HEIM/financials/annual/balance-sheet') inv_n = html.fromstring(

    1熱度

    1回答

    以下情況:我編寫了一個提供某些功能的模塊。這樣做可以調用一些命令並解析它們的輸出。在某個時候,我現在擴展了這個模塊,使它能夠解析XML輸出。當然,從那時起,這個模塊現在依賴於lxml。我沒有給出這麼多的想法,因爲lxml不是一個很大的交易。 直到我 - 只是偶然 - 碰巧在Raspbian安裝上使用我的python模塊。由於此安裝非常新,我嘗試使用pip安裝lxml。該平臺未能編譯。 (我猜是因爲