我用下面的代碼我能做些什麼,使這個代碼的運行速度
java -Xmx4g -jar /full path/GenomeAnalysisTK.jar \ -T HaplotypeCaller \ -R /full path/hg19-sorted.fasta \ -I example.bam --genotyping_mode DISCOVERY \ -stand_call_conf 30 \ -o example.bam.output.raw.snps.indels.vcf
一個BAM文件大約成本覈算10-15d完成最近運行GATK HaplotypeCaller在共享存儲服務器運行... 極其耗費時間,不是嗎? 想到任何解決方法以使此過程更快?例如增加-Xmx?g參數來重新分配內存?我現在有一臺配備62個CPU的服務器,我應該如何確定-Xmx?g的值以最好地重新分配內存以使運行速度更快?或者解決時間成本問題的其他方法?許多tks提前!
您忘記了最重要的命令行參數。 '-showusyourcode' – selbie
說真的,沒有人能夠從運行時參數中幫助診斷性能問題。您需要向我們展示您的代碼。 – selbie
先對任何非專業問題抱歉。詳細的源代碼顯示在這裏https://github.com/broadgsa/gatk-protected/blob/master/protected/gatk-tools-protected/src/main/java/org/broadinstitute/gatk/tools/walkers /haplotypecaller/HaplotypeCaller.java – Menci