我想在使用BeautifulSoup.BeautifulStoneSoup
的XML文檔中包含編碼標籤,但我不知道該怎麼做!BeautifulSoup:如何在輸出中包含編碼?
<?xml version="1.0" encoding="UTF-8"?>
<mytag>stuff</mytag>
它在輸出編碼標籤,當我閱讀已經有它的文檔,但我正在做一個新的湯。
謝謝!
編輯:我將舉一個我目前正在做的事情的例子。
from BeautifulSoup import BeautifulStoneSoup, Tag
soup = BeautifulStoneSoup()
mytag = Tag(soup, 'mytag')
soup.append(mytag)
str(soup)
# '<mytag></mytag>'
soup.prettify() # No encoding given
# '<mytag>\n</mytag>'
soup.prettify(encoding='UTF-8')
# '<mytag>\n</mytag>' # Where's the encoding?
即使我創建湯像BeautifulStoneSoup(fromEncoding='UTF-8')
,但仍然沒有<?xml?>
標籤。
是否有另一種方式來獲得該標籤沒有創建並直接將標籤作爲字符串傳遞,或者是唯一的方法?
美麗的湯不是一個XML *生成器*。美化方法只是爲了方便。爲什麼不直接使用lxml? – zwol
@Zack:部分原因是因爲我執行的幾乎所有XML用法都是解析,所以BeautifulSoup聽起來像是一個好主意;部分原因是所有的建築方法已經被設置爲與BeautifulSoup一起使用,所以重寫它們聽起來不太吸引人。但我一定會記得下次嘗試lxml。 – TorelTwiddler