bioinformatics

    1熱度

    1回答

    有沒有辦法下載並保存Entrez模塊返回到本地磁盤的XML文件?什麼我目前做的是: fetch = Entrez.efetch(db='pmc', resetmode='xml', id=ids, rettype='full') article = fetch.read() 然後保存article這是一個str對象通過Python的寫入功

    2熱度

    5回答

    我有一些長度只有4個字符的字符串,它們是'A,T,G和C'。我在給定的字符串中出現了多次「GAATTC」模式。我不得不削減的字符串在間隔,其中這種模式.. 例如,對於一個字符串,「ATC GAATTC ATA」,我應該得到的 串一個輸出 - ATCGA 線二 - ATTCATA 我是新手在使用Python,但我想出了以下(不完全)代碼: seq = seq.upper() str1 = "GAA

    -1熱度

    1回答

    我需要創建一個程序,可以將一些文本文件稱爲fasta文件並將其轉換爲sequence_name,Domain_names,Domain of Domain,Domain of Domain。 所以一個FASTA文件只是一個文本文件,它看起來像這樣 >MICE_8 ATTCGATCGATCGATTTCGATCGATCGATCGATCGGGATCGATCGATCGATCGATC >MICE_59

    -3熱度

    1回答

    我發現R中的軟件包類似於我在Github中的工作。如何使用我的數據集而不是其數據集。任何教程或視頻爲此,.Thanks先進

    3熱度

    3回答

    的範圍在下面的數據合併兩隻大熊貓dataframes(或轉讓值): data01 = contig start end haplotype_block 2 5207 5867 1856 2 155667 155670 2816 2 67910 68022 2 2 68464 68483 3 2 525 775 132 2 118938 119559 1157 data02 =

    1熱度

    1回答

    外觀的數量對於k聚https://en.wikipedia.org/wiki/K-mer 我試圖找到一個大的fastq文件最常見的k聚體。我的計劃是使用MISRA-格里斯算法來找出最頻繁的k聚體,然後用第二遍搜索每一個頻繁k鏈節的數量在文件中。但我認爲我的算法不夠高效。以下是我的第一份草案。我儘量內存儘可能高效。(程序不能運行內存不足) 我也發現了這個DSK算法,但是這個人是太難受,沒有看到一個簡

    3熱度

    1回答

    我有一個文件,如下面的小例子。每4行都與一個ID相關。每個ID的第二行以N開頭。我想在行首開始刪除N,其他所有內容都保持不變。 我想在python中做到這一點。你知道怎麼做嗎? 例如: @SRR2163140.1 HISEQ:148:C670LANXX:3:1101:1302:1947 length=50 NGCGACCTCAGATCAGACGTGGCGACC +SRR2163140.1 HI

    1熱度

    1回答

    這是我的第一篇文章,因此對任何不便之處表示道歉。 我想從它的函數getProfileData()從cBioPortal中提取RNAseq數據。我想用列表元素生成的參數在我的列表的每個元素上調用這個函數。我包括一個圖書館,例如癌症和可以通過此功能調用的示例基因。 library(cgdsr) mycgds = CGDS("http://www.cbioportal.org/") cancers

    1熱度

    2回答

    我試圖通過在每行中的空格之間添加「 - >」和「:」來追加字符串列表。我的電流輸出是這樣的: 0 1 A 1 2 T 2 3 A 3 4 G 4 5 A 2 6 C 0 7 G 7 8 A 8 9 T 但我想它看起來像: 0->1:A 1->2:T 2->3:A 3->4:G 4->5:A 2->6:C 0->7:G 7->8:A 8->9:T 你可以找到我

    3熱度

    1回答

    我想在Python中使用bioformats讀取顯微鏡圖像(.lsm,.czi,.lif ,你將其命名),打印出元數據並顯示圖像。 ome = bf.OMEXML(md)給我一個錯誤(下面)。我想這是關於存儲在md內的信息。它不喜歡md中的信息不全是ASCII。但是,我如何克服這個問題呢? 這是我寫的: import Tkinter as Tk, tkFileDialog import os