我想從文本文件中讀取令牌並檢查特定的關鍵字。我會怎麼做? 例如我的文件看起來像這樣:在python上閱讀令牌
<protein id="Q11" name="HUMAN" length="655" crc64="30E1C1D138">
<match id="G3DSA:3.30.160.60" name="ZC2f_H2/iegse_NA-bd" dbname="GE3D" status="T" evd="HMPfm">
<ipr id="IPR013087" name="Zinc finger, H2-type/inrase, D-bindg" tpe="Dain" />
<ln stt="114" end="142" sc="1.0E-8" />
</match>
(我想跳過第一行,並尋找對dbname必須等於GE3D第二行令牌如果是我想要存儲的STT數。 。和結束號碼)
*,所以我這樣做,但我不知道它爲什麼只返回我一數開始和換下場,因爲不止一個數量應滿足的要求:從LXML進口主菜
filename ='inQ14591.txt'
開放(文件名, 'RB')爲f:
root = etree.parse(f)
for ln in root.xpath("/protein/match[@dbname='GE3D']/ln"):
start = ln.get("stt")
end = ln.get("end")
打印(STT)
打印結束
你試過了什麼? – 0605002 2012-07-06 15:44:26
看起來像XML,你有沒有嘗試使用lxml編寫解析器? – 2012-07-06 15:46:16