bioinformatics

    7熱度

    1回答

    自從昨天以來,我陷入了一個小而棘手的問題。 我所擁有的是一個(可能無限)嵌套表是這樣的: [1,[2,[3,4]]] or [[1,2],[3,4]] and so on. 每個級別上的列表包括兩個子表,(我沒有使用元組,因爲該名單可能會得到任意長度在下一步中) 現在我想在此列表中的每個可能位置插入一個元素,並返回所有可能插入位置列表的列表。 所以,如果我插入5,我的輸出應該是這樣的: [

    -1熱度

    1回答

    我正在尋找一種方式從pubmed或任何其他來源下載作者和相關的文章數據庫。我似乎無法在ncbi FTP站點的任何位置找到它。 有誰知道是否有這樣的數據庫可用?

    1熱度

    3回答

    我想在Python中使用滑動窗口函數來比較一個非常長的值列表。我已經找到了滑動窗函數的代碼如下: from itertools import islice idlist = [1, 2, 3, 4, 5, 6, 7, 8, 9] list = [] def window(seq, n=2): "Returns a sliding window (of width n) over

    1熱度

    1回答

    我現在正在處理的問題要求,鑑於R中的系統發育樹對象和該樹的特定提示,我需要找到所有該分支的長度達到該提示。爲phylo或phylo4對象尋找這個將是等價的,因爲我可以在這兩種對象之間自由轉換。 我想這應該不會複雜。包「phylobase」提供了查找預先指定節點的所有祖先的功能,並且我們可以使用phylo4對象的@ edge.lengths訪問樹上的邊長。 但是,我無法訪問邊緣標籤上的字符串操作而需

    1熱度

    1回答

    我試圖從Clustalw多序列比對中生成Biopython中的位置加權矩陣(PWM)。每當我用缺口對齊方式進行操作時,我會收到「錯誤的字母」錯誤。從閱讀文檔,我想我需要利用空白字母來處理空格對齊中的' - '字符。但是當我這樣做時,它仍然不能解決錯誤。有沒有人看到這個代碼的問題,或者有更好的方法來從缺口Clustal對齊生成PWM? from Bio.Alphabet import Gapped

    3熱度

    2回答

    我有序列DNA,我想在人們選擇的位置找到序列的核苷酸。下面是例如: 輸入序列的DNA: ACTAAAAATACAAAAATTAGCCAGGCGTGGTGGCAC(序列長度爲33) 輸入位置:(12) 希望的結果是位置編號12的核苷酸是AAA。 我沒有問題找到位置的氨基酸。以下是我現在的代碼。 print "ENTER THE FILENAME OF THE DNA SEQUENCE:= "; $

    1熱度

    1回答

    我有SNP數據和gen列表數據。當我和gen列表比較時,我正在查找gen列表數據中的SNP cotain的位置。例如: 的SNP數據: Pos_start pos_end 14185 14185 .... ..... 的根目錄數據: 5"side(pos_start) 3"sile(pos_end) 1 1527 1920 1777 ..

    -2熱度

    1回答

    現在我有了數據(txt文件)。我如何找到a位置和b位置的Mod值。 例如: my data: posi 13628 16195 GTG GAA BL4_0018 14185 14185 T C 20000 16543 ATG GAC BL4_0019 Hope The result : posi Mod value 16195 GTG

    9熱度

    4回答

    我在尋找真實世界的應用,其中拓撲分類在大圖大小上執行。 一些我可以找到這種實例的領域是生物信息學,依賴關係解析,數據庫,硬件設計,數據倉庫......但是我希望你們中的一些人可能遇到或聽說過任何特定的算法/項目/應用程序/需要topsort的數據集。 即使數據/項目可能無法公開訪問,任何提示(以及對潛在圖形大小數量級的估計)都可能有所幫助。

    5熱度

    3回答

    我被要求研究蛋白質結構可視化,像RasMol,其中用戶將打開一個pdb文件來獲取蛋白質結構。 如何從pdb文件生成蛋白質結構? 我想在Python中編寫代碼並使用OpenGL或VTK可視化結構?在這方面有沒有其他模塊可以幫助我?