我在Python中用ElementTree解析XML,並且必須檢查樹中的每個浮點數是否都帶有「,」而不是「。」。但我不知道如何到達我的樹的每個孩子,這是從一個+ 100K行的XML創建非常大。檢查ElementTree的每個值
這是一個很短的樣品,不過:
<example tr="3,1">
<test>2.1</test>
<stack>
<nb>2,5</nb>
<nb>5.1</nb>
</stack>
</example>
我想檢查,如果這是一個浮動的任何值是用逗號或一個點。我的問題是要用任何一棵樹達到一棵樹的每個價值。
到目前爲止,我嘗試這樣做:
tree = ET.parse(chemin, parser=LineNumberingParser())
root = tree.getroot()
float_text_info = []
for element in root.getiterator():
if element is not None:
element_value = element.text.strip()
if element_value and re.findall('\d+[\.|,]\d+', element_value):
float_text_info.append(element_value)
你能提供樣本輸入和你試試嗎? –
請編輯您的問題以包含您的示例,而不是在評論中回答。你還可以向我們展示你迄今爲止的嘗試嗎? –
好吧..我進入了算法,以達到我的樹的每個價值,但我不知道它是否是好主意,因爲它的能量vore ..也許東西已經存在 –