那麼對齊工具Clustal可以對齊,也可以用適當的標誌來製作樹。我相信,如果你創建一個fasta文件,其中包含所有序列,包括最大的一個宏基因組。它可以使你根據對齊分數自動生成系統發育樹。我不確定這是否能夠實現你所期望的一切,但這是一個開始。您可能必須創建幾個.fasta文件,以使用一些智能設計和先前的知識來對齊以產生所需的結果。這裏是一個Perl腳本,我寫了,使比對和系統進化樹:
#!/usr/bin/perl
use warnings;
print "Please type the list file name of protein fasta files to align (end the directory path with a/or this will fail!): ";
$directory = <STDIN>;
chomp $directory;
opendir (DIR,$directory) or die $!;
my @file = readdir DIR;
closedir DIR;
my $add="_align.fasta";
foreach $file (@file) {
my $infile = "$directory$file";
(my $fileprefix = $infile) =~ s/\.[^.]+$//;
my $outfile="$fileprefix$add";
system "/Users/Wes/Desktop/eggNOG_files/clustalw-2.1-macosx/clustalw2 -INFILE=$infile -OUTFILE=$outfile -OUTPUT=FASTA -tree";
}
你或許應該支持這樣的:http://area51.stackexchange.com/proposals/6729/bioinformatics;同時你可以在http://scicomp.stackexchange.com/找到幫助。 – Marcin 2012-01-28 14:46:52
可能更好的地方來問這個問題在這裏:http://biostar.stackexchange.com/ – PhiS 2012-01-29 14:42:27