我需要解析初步GenBank平面文件。該序列尚未發佈,因此我無法通過加入來查找並下載FASTA文件。我是生物信息學的新手,所以有人可以告訴我在哪裏可以找到BioPerl或BioPython腳本來自己做這件事?謝謝!將GenBank平臺文件轉換爲FASTA
2
A
回答
0
您需要Bio::SeqIO模塊讀取或寫出生物信息學數據。 SeqIO HOWTO應該告訴你一切你需要知道的,但here's a small read-a-GenBank-file script in Perl讓你開始!
+1
謝謝,這適用於正常的genbank文件,但我的實際上是一個初步提交,所以我必須解析它自己。 – user81997 2011-06-14 13:24:35
1
我在這裏爲您提供Biopython解決方案。我會首先假設你的genbank文件涉及到一個基因組序列,然後我會提供一個不同的解決方案,假設它是一個基因序列。事實上,知道你正在處理哪些事情會有幫助。
基因組序列解析:在您的自定義GenBank中簡單文件
解析來自文件:
from Bio import SeqIO
record = SeqIO.read("yourGenbankFileDirectory/yourGenbankFile.gb","genbank")
如果你只是想那麼原始序列:
rawSequence = record.seq.tostring()
現在也許你需要爲此序列命名,在製作.fasta之前爲序列提供「>標題」。
nameSequence = record.features[0].qualifiers
這應返回與整個序列的各種同義詞詞典由基因庫文件的作者作爲註釋
基因序列解析:讓我們看看與GenBank中.gb文件來幹什麼名
解析從文件中通過自定義GenBank中簡單文件:
from Bio import SeqIO
record = SeqIO.read("yourGenbankFileDirectory/yourGenbankFile.gb","genbank")
要獲得的原料清單
rawSequenceList = [gene.extract(record.seq.tostring()) for gene in record.features]
以獲得每個基因序列名稱的列表(更準確地說是每個基因同義詞的詞典)
nameSequenceList = [gene.qualifiers for gene in record.features]
相關問題
- 1. 請幫助我從磁盤讀取genbank文件並將其轉換爲fasta
- 2. 如何將兩列的文本文件轉換爲fasta格式
- 3. 從tsv轉換爲fasta
- 4. 如何將python.py文件轉換爲可執行文件以使用跨平臺?
- 5. 如何將mysql平臺特定的查詢轉換爲非平臺特定的?
- 6. C#將任何字符串轉換爲安全的跨平臺文件名?
- 7. 將文件轉換爲流
- 8. 將JasperPrint轉換爲文件
- 9. 將CommonsMultipartFile轉換爲文件
- 10. 將文件轉換爲NTFS
- 11. 將UploadedFile轉換爲文件
- 12. 將IFile轉換爲文件
- 13. 如何在Azure平臺上使用PHP將.MPG轉換爲.FLV
- 14. 如何將xml轉換爲android平臺上的sqlite數據庫?
- 15. 將odex文件轉換爲dex文件
- 16. 將.so文件轉換爲.dll文件
- 17. 將.pk8文件轉換爲.key文件
- 18. 將.cptx文件轉換爲.swf文件
- 19. 將YAML文件轉換爲PHP文件
- 20. 將NIB文件轉換爲XIB文件
- 21. 將.mov文件轉換爲.h264文件
- 22. 將html文件轉換爲PDF文件?
- 23. 將.fntdata文件轉換爲.ttf文件
- 24. 將BED文件轉換爲WIG文件
- 25. 將.cer文件轉換爲.pfx文件
- 26. 將.jrxml文件轉換爲.pdf文件
- 27. 將.dat文件轉換爲.xls文件
- 28. 將.php文件轉換爲.html文件?
- 29. 將wav文件轉換爲wav文件
- 30. 將apk文件轉換爲zip文件
谷歌搜索「biopython解析:所有基因的基因/列表,然後序列fasta「將這個http://www.biopython.org/wiki/SeqIO作爲第一場比賽。第二場比賽是解析fasta的教程。這是你想要的? – 2011-06-13 22:01:56
當然,使用「bioperl解析fasta」的搜索結果也會給出正確的結果,如常見問題解答:「我想解析FASTA或NCBI -m7(XML)格式,我該如何做?在http://www.bioperl.org/wiki/FAQ#I_want_to_parse_FASTA_or_NCBI_-m7_.28XML.29_format.2C_how_do_I_do_this.3F – mirod 2011-06-14 07:16:38