bioinformatics

    0熱度

    1回答

    我想使用snakemake製作一個生物信息學流水線,並使用Google搜索它並閱讀文檔和其他內容,但是我仍然不知道如何使它工作。 這是我的一些原始數據文件。 RAWDATA/010_0_bua_1.fq.gz,RAWDATA/010_0_bua_2.fq.gz RAWDATA/11_15_ap_1.fq.gz,RAWDATA/11_15_ap_2.fq.gz ...他們都是配對的文件。) 這裏是我

    0熱度

    2回答

    我目前正在編寫「正在做」的程序,並繪製DNA樣本的相位分析,並且出現了一些問題:Output plot HERE!右側的圖像來自MATLAB並且是它應該如何看起來的例子。左邊的圖像是從我的程序輸出的。正如你所看到的藍色圖形看起來是正確的,但它是在不同的角度。我檢查過代碼,它和我的程序的MATLAB版本基本相同。無論如何,我會把它放在這裏,也許有一個我不知道的錯誤。但如果不是這樣,是否有一種「轉向/

    1熱度

    3回答

    請幫我解析一個VCF文件。我正在粘貼一個真實的例子。 輸入: 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L

    0熱度

    1回答

    我有一個數據集包含DNA序列,我想將它們轉換成數字表示。本文件中: 這是什麼過程(轉變),我想搜索一下嗎? 如何在python中應用它? 它可以作爲一個大數組,作爲數據集輸入嗎?

    -1熱度

    1回答

    我想分配兩個文件作爲輸入文件。下面一個例子: directory1 AB001.txt AB002.txt AB003.txt .... directory2 AB001.fasta AB002.fasta AB003.fasta .... 所以,我要遍歷超過5000 * .txt文件與相應的* .fasta文件(總是相匹配的前綴)。所有* .txt文件應該執行的命令是:

    -4熱度

    1回答

    我想如下修改如下程序: 第一行包含蛋白質的名稱和計數隨後的這種蛋白質的輸出線(如N) 接下來的N行中的每一行都包含一個匹配信息:GBoxes的位置和實際匹配(記住存在擾動和X的即通配符,允許)。 腳本: import csv import matplotlib.pyplot as plt import numpy as np # all G boxes def match(x,y):

    1熱度

    2回答

    我已經看過以前提過的關於在列表中保留'for循環'輸出的問題,但我似乎無法將其應用於我的函數。 也許有人可以給我一個關於我做錯了什麼的線索。 dna_seqs <- list('id1', 'ATGGCAATAACCCCCCGTTTCTACTTCTAGAGGAGAAAAGT', 'id2', 'TCCGTTAAGATATTCTTACGTGTGACGTAGCTATGTATTTTGCAGAGCTGGC

    1熱度

    1回答

    我要生成硒代半胱氨酸的標誌,但是當我選擇的選項與reduced_protein_alphabet我得到錯誤「但卻難免重複字母」 weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry

    1熱度

    1回答

    我是新手,嘗試使用snakemake(上週左右),以便處理較少的工作流細節,以前我編寫了自己的特定工作流程通過python。 我生成了一個小工作流程,其中的步驟之間將使用Illumina PE讀取並運行Kraken對他們。然後,我會解析Kraken輸出的輸出,以檢測最常見的物種(在一組允許範圍內),如果沒有提供物種值(使用snakemake運行-s test.snake --config R1_r

    1熱度

    1回答

    我想用命令system()在R中運行shell腳本(BLAST + in NCBI),但它似乎只使用一個線程,即使我在shell腳本中設置了多個線程。在這種情況下,我應該怎麼做才能使用多線程? 的代碼是 system("blastp -query query.fasta -db db.fasta -num_threads 16 -outfmt \"6 qseqid sseqid pident pp