我有一個看起來像這樣(但更大)的文件:解析文本文件一行行,跳過某些行
>some text
ABC
DEF
GHI
>some more text
JKL
MNO
PQR
我已經玩了Java中有一段時間,並已能夠用線條構建數組等。具有'>'的線條通常是一條線,但有時可能是2條,3條或更多條線。不以'>'開始的行的字符長度相同,但可能有10,20或30或更多這些行。我在點現在在哪裏,我想創建一個字符串數組,數組中的每個字符串包含不以「>」,像這樣開頭的行的字符串:
array element 1 = ABCDEFGHI
array element 2 = JKLMONPQR
我覺得像我很近,但需要一個小屁股踢我才能去。我確信這對專業人士來說很容易,但我對Java仍然很陌生。
具體問題與我在此板上製作的其他帖子有關。這是一個FASTA文件:
>3BHS_BOVIN (P14893) 3 beta-hydroxysteroid
AGWSCLVTGGGGFLGQRIICLLVEEKDLQEIRVLDKVFRPEVREEFSKLQSKIKLTLLEG
DILDEQCLKGACQGTSVVIHTASVIDVRNAVPRETIMNVNVKGTQLLLEACVQASVPVFI
>41_BOVIN (Q9N179) Protein 4.1
MHCKVSLLDDTVYECVVEKHAKGQDLLKRVCEHLNLLEEDYFGLAIWDNATSKTWLDSAK
EIKKQVRGVPWNFTFNVKFYPPDPAQLTEDITRYYLCLQLRQDIVSGRLPCSFATLALLG
SYTIQSELGDYDPELHGADYVSDFKLAPNQTKELEEKVMELHKSYRSMTPAQADLEFLEN
>5NTD_BOVIN (Q05927) 5'-nucleotidase
MNPGAARTPALRILPLGALLWPAARPWELTILHTNDVHSRLEQTSEDSSKCVNASRCVGG
VARLATKVHQIRRAEPHVLLLDAGDQYQGTIWFTVYKGTEVAHFMNALGYESMALGNHEF
DNGVEGLIDPLLKEVNFPILSANIKAKGPLASKISGLYSPYKILTVGDEVVGIVGYTSKE
TPFLSNPGTNLVFEDEITALQPEVDKLKTLNVNKIIALGHSGFEVDKLIAQKVKGVDVVV
我最終需要在他們自己的數組元素中的序列,以便我可以稍後操作它們。
什麼是* *的具體問題?你知道如何連接字符串嗎?你知道如何識別一個字符串是否以'>開頭'''? – 2011-06-14 23:11:55
我有一個文件行的數組,我可以確定哪些以'>'開頭,是的...我也可以連接行,但只選擇那些並將它們作爲數組中的元素是我的位置遇到麻煩。 – nicorellius 2011-06-14 23:16:24