我試着去找到一個詞,是一個文件,然後搜索這個詞在兩個不同的文件 - 要搜索的第一個文件,如果這個詞是單詞的那個線打印在一個新文件 中 - 在第二個文件中搜索相同的單詞,並且如果發現該單詞在第一個文件中找到的行後面的同一個輸出文件中打印出第二個文件中找到的行,表格編號爲。查找兩個文件蟒相同的模式
這是我寫的劇本:
for line in first_file:
for line2 in second_file:
for word in keywords:
if re.match (r"\b"+word+r"\b" , line):
result = (line.strip()+'\t'+line2.strip())
print (result, file = new_file)
但是,我得到的始終是一個空文件的結果。
This is an example of the first file :
contig-39000000 1211 11.3902
contig-44000000 6128 17.8944
contig-91000000 2180 14.2197
this is an example of the second file
contig-316000330 out.18
contig-39000000 out.25
...
,這是搜索文件的例子
contig-39000000
contig-289000379
contig-300000489
contig-310000168
contig-310000172
contig-320000463
contig-324000213
contig-327000055
contig-341000436
contig-342000384
....
預期的結果會是什麼樣子:
contig-39000000 1211 11.3902 out.25
謝謝
請提供輸入文件的樣本片段... – albert
請那些增加的問題作爲編輯。你想找哪個詞組?整條線或只是一個具體的表達? – albert
我的猜測是:'second_file'是'file'對象,即一個迭代器,並且在第一個文件的第一個單詞之後,該迭代器耗盡,所以不能找到其他單詞。 –