我在編碼方面很新穎,我試圖弄清楚如何解決這個問題: 找到所有以#開頭的標題和第7個字有「PASS」的行列並將它們打印到new.vcf。通行證可能出現在其他欄目中,但是在第7欄中它會單獨出現並且全部大寫。這些文件是製表符分隔的。 我已經完成了問題的第一部分,但無法弄清楚如何從第7欄中拉出「PASS」。這是我迄今爲止的總代碼。在python中讀寫
#!/usr/bin/env python
myfile= open("temp.vcf","r")
outfile= open("new.vcf","w")
for data in myfile:
data = data.strip("\t")
if data[0] == "#":
outfile.write(data +"\n")
myfile.close()
outfile.close()
myfile=open("temp.vcf","r")
outfile=open("new.vcf","a")
data=myfile.readline()
while data == "PASS":
outfile.write(data+"/t")
data=myfile.readline()
myfile.close()
outfile.close()
爲了給你一些真實的幫助,一個樣本輸入和一個預期的輸出將非常有用。 – jonathanmarvens 2013-02-22 03:26:29