我正試圖從文本文件中提取DNA序列並將其存儲。我可以使用下面的代碼來完成它,但這不是最好的方法,因爲我正逐行閱讀文本文件。我想知道如果沒有逐行讀取文本文件,是否有更簡單的方法可以在我的文本文件中查找每個DNA序列。如何在不逐行閱讀的情況下從文本文件中提取DNA序列?
example.pl
#!/usr/local/bin/perl
open(MYFILE, 'data.txt');
@entire_file = <MYFILE>;
while (<MYFILE>) {
chomp;
print "$_\n";
}
$line1 = <MYFILE>;
chomp $line1;
$line2 = <MYFILE>;
chomp $line2;
$line3 = <MYFILE>;
chomp $line3;
$line4 = <MYFILE>;
chomp $line4;
$line5 = <MYFILE>;
chomp $line5;
#Prints DNA sequence 1
print "$line2";
#Prints DNA sequence 2
print "$line5";
close(MYFILE);
data.txt中
GI | 171361,釀酒酵母,(CYS3)基因,實驗1,喬布羅格斯 GCAGCGATCGACAGCTGTGCTATCCCGGCGAGCCCGTGGCAGAGGACCTCGCTTGCGAAAGCATCGAGTACC
GI | 171362,釀酒酵母(CYS4)基因,實驗室2,Paul McDonald GAAGCGCACGACAGCTGTGCTATCCCGGCGAGCCCGTGGCAGAGGACCTCGCTTGCGAAAGCATCGA GTACC
你怎麼會喜歡閱讀嗎? – robbieAreBest 2012-08-14 14:29:12
這應該不起作用,因爲您正在閱讀整個文件,然後搭售閱讀更多數據。在循環之後,您應該使用'@ entire_file'而不是''。 –
perreal
2012-08-14 14:38:58
我已經閱讀了模式匹配,只是不知道該怎麼做。那麼多符號。我希望能夠識別像DNA序列GATC等的模式並存儲它,而不必閱讀文本文件中的每一行。如果你能幫忙,請幫忙。謝謝。 :) – 2012-08-14 14:49:18