bioinformatics

0熱度

1回答

我想使用snakemake製作一個生物信息學流水線，並使用Google搜索它並閱讀文檔和其他內容，但是我仍然不知道如何使它工作。這是我的一些原始數據文件。 RAWDATA/010_0_bua_1.fq.gz，RAWDATA/010_0_bua_2.fq.gz RAWDATA/11_15_ap_1.fq.gz，RAWDATA/11_15_ap_2.fq.gz ...他們都是配對的文件。）這裏是我

0熱度

2回答

如何在python中以某個角度「降低」圖形

我目前正在編寫「正在做」的程序，並繪製DNA樣本的相位分析，並且出現了一些問題：Output plot HERE!右側的圖像來自MATLAB並且是它應該如何看起來的例子。左邊的圖像是從我的程序輸出的。正如你所看到的藍色圖形看起來是正確的，但它是在不同的角度。我檢查過代碼，它和我的程序的MATLAB版本基本相同。無論如何，我會把它放在這裏，也許有一個我不知道的錯誤。但如果不是這樣，是否有一種「轉向/

1熱度

3回答

解析VCF文件的INFO字段

請幫我解析一個VCF文件。我正在粘貼一個真實的例子。輸入： 1 1014143 rs786201005 C T . . RS=786201005;RSPOS=1014143;dbSNPBuildID=144;SSR=0;SAO=1;VP=0x050068000605000002110100;GENEINFO=ISG15:9636;WGT=1;VC=SNV;PM;PMC;NSN;REF;ASP;L

0熱度

1回答

進入特徵的DNA序列

我有一個數據集包含DNA序列，我想將它們轉換成數字表示。本文件中：這是什麼過程（轉變），我想搜索一下嗎？如何在python中應用它？它可以作爲一個大數組，作爲數據集輸入嗎？

-1熱度

1回答

將文件分配給對方

我想分配兩個文件作爲輸入文件。下面一個例子： directory1 AB001.txt AB002.txt AB003.txt .... directory2 AB001.fasta AB002.fasta AB003.fasta .... 所以，我要遍歷超過5000 * .txt文件與相應的* .fasta文件（總是相匹配的前綴）。所有* .txt文件應該執行的命令是：

-4熱度

1回答

修改代碼，以便它可以從文件中讀取，併產生相應的輸出

我想如下修改如下程序：第一行包含蛋白質的名稱和計數隨後的這種蛋白質的輸出線（如N）接下來的N行中的每一行都包含一個匹配信息：GBoxes的位置和實際匹配（記住存在擾動和X的即通配符，允許）。腳本： import csv import matplotlib.pyplot as plt import numpy as np # all G boxes def match(x,y):

1熱度

2回答

將for循環的輸出添加到列表中

我已經看過以前提過的關於在列表中保留'for循環'輸出的問題，但我似乎無法將其應用於我的函數。也許有人可以給我一個關於我做錯了什麼的線索。 dna_seqs <- list('id1', 'ATGGCAATAACCCCCCGTTTCTACTTCTAGAGGAGAAAAGT', 'id2', 'TCCGTTAAGATATTCTTACGTGTGACGTAGCTATGTATTTTGCAGAGCTGGC

1熱度

1回答

Weblogo - 硒字母

我要生成硒代半胱氨酸的標誌，但是當我選擇的選項與reduced_protein_alphabet我得到錯誤「但卻難免重複字母」 weblogo -f sc.txt -D fasta -o sc_logo -F pdf -a reduced_protein_alphabet -s large -n 100 -c chemistry

1熱度

1回答

snakemake是用於處理輸出中介工作流程的正確工具

我是新手，嘗試使用snakemake（上週左右），以便處理較少的工作流細節，以前我編寫了自己的特定工作流程通過python。我生成了一個小工作流程，其中的步驟之間將使用Illumina PE讀取並運行Kraken對他們。然後，我會解析Kraken輸出的輸出，以檢測最常見的物種（在一組允許範圍內），如果沒有提供物種值（使用snakemake運行-s test.snake --config R1_r

1熱度

1回答

使用多線程在R中運行shell腳本

我想用命令system（）在R中運行shell腳本（BLAST + in NCBI），但它似乎只使用一個線程，即使我在shell腳本中設置了多個線程。在這種情況下，我應該怎麼做才能使用多線程？的代碼是 system("blastp -query query.fasta -db db.fasta -num_threads 16 -outfmt \"6 qseqid sseqid pident pp