bioinformatics

    6熱度

    2回答

    我嘗試對已經對齊的序列進行評分。 讓說 seq1 = 'PAVKDLGAEG-ASDKGT--SHVVY----------TI-QLASTFE' seq2 = 'PAVEDLGATG-ANDKGT--LYNIYARNTEGHPRSTV-QLGSTFE' 與給定參數 substitution matrix : blosum62 gap open penalty : -5 gap exte

    4熱度

    2回答

    我有一個蛋白質名稱列表(P1,P2,...,Pn),它們被分爲三個不同的表達水平高(H),中(M)和低(L )在三個實驗條件(Exp1,Exp2和Exp3)中測量。 我想繪製一張如圖中底部所示的圖,左邊的蛋白質名稱以及沿頂部和高,中,低等級的實驗名稱用紅色表示,藍色和綠色。 我是R的新手,我非常感謝任何幫助。 在此先感謝

    5熱度

    1回答

    我試圖找到基因名稱和染色體位置的gene_info文件。但是,我似乎無法在NCBI FTP站點上找到它。任何人都可以給我一個指針?

    0熱度

    2回答

    我有一個很長的序列,在整個序列字符串中隨機地重複一個特定的字符串('說GAATTC')。我目前使用正則表達式.span()向我提供模式'GAATTC'所在的索引。現在我想用這些索引來切割G和A之間的模式(即'G | AATTC')。 如何使用匹配對象中的數據將它們分割出來?

    3熱度

    4回答

    我在處理生物信息學項目時遇到了一些編碼問題。基本上,我的任務是從數據庫中提取基序序列,並使用這些信息來註釋序列比對文件。對齊文件是純文本,因此註釋不會有任何細節,最好只是用對齊文件本身中的星號替換提取的序列。 我有一個腳本,它掃描數據庫文件,提取所有我需要的序列,並將它們寫入輸出文件。我需要的是,在給出查詢的情況下,讀取這些序列並將它們匹配到ASCII對齊文件中相應的子字符串。最後,對於每個出現的

    2熱度

    2回答

    我目前正在尋找商業與非商業爆破工具。我已經多次使用NCBI blast來進行當地的blast搜索,但現在我正在尋找有趣的替代方案。在我的搜索過程中,我發現了一些有趣的結果,如CUDA-Blast,GPU-Blast,WU-Blast,BlastStation2,mpiBlast和Turboblast。任何人都可以使用這些工具?或者有沒有類似BlastStation2的工具,我錯過了?我錯過了任何重

    0熱度

    2回答

    我正在定義一個函數,它將返回列表,其中元素零是2D陣列,元素之一是標題信息,元素2是rowname。我怎樣才能從文件中讀取這其中 文件看起來像這樣: 基因S1,S2,S3 S4 S5 100 -0.243 -0.021 -0.205 -1.283 0.411 10000 - 1.178 -0.79 0.063 -0.878 0.011 def input2DarrayData(fn):

    1熱度

    3回答

    我正在定義一個函數來計算列表的標準偏差。有時這個列表的意思是否定的,所以我的函數不能取消一個負數的平方根,返回給我一個錯誤。 這似乎很簡單,我只是想不起來。我想爲我的函數寫一個條件,說如果有一個負數,乘以-1,因爲負數的平方根不能被採用。 我該怎麼寫這句話? def stdevValue(lst): """calculates the standard deviation of a list o

    1熱度

    2回答

    嗨 我有兩個CSV文件作爲輸入,例如: 文件1: AK163828 chr5 s1 + e1 cttt 4 AK163828 chr5 s2 + e2 gtca 4 AK168688 chr6 s3 + e3 ggcg 4 AK168688 chr6 s4 + e4 tctg 4 文件2: chr6s3+e3 ggcg chr5s1+e1 cttt chr6s4+e4 tata c

    1熱度

    1回答

    Biopython noob在這裏,我試圖創建一個程序,使用Biopython包字母和字母模塊IUPAC寫出名爲alphabetSoupOutput.txt的文件列出的類的字母。 ThreeLetterProtein IUPACProtein unambiguous_dna ambiguous_dna ExtendedIUPACProtein ExtendedIUPACDNA 字母每組應該在輸出文