請幫我解析一個VCF文件。我正在粘貼一個真實的例子。 輸入: 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L
我想如下修改如下程序: 第一行包含蛋白質的名稱和計數隨後的這種蛋白質的輸出線(如N) 接下來的N行中的每一行都包含一個匹配信息:GBoxes的位置和實際匹配(記住存在擾動和X的即通配符,允許)。 腳本: import csv
import matplotlib.pyplot as plt
import numpy as np
# all G boxes
def match(x,y):
我要生成硒代半胱氨酸的標誌,但是當我選擇的選項與reduced_protein_alphabet我得到錯誤「但卻難免重複字母」 weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry