2017-08-28 347 views
0

我想從基因符號(例如:TTN)和基因ID(例如:ENSG00000155657)中獲取人類基因組的基因位置。我想用biomaRt的R包來做。我該怎麼做?從基因符號和ID獲取基因位置

+1

您可以先閱讀[biomaRt用戶指南](https://bioconductor.org/packages/release/bioc/vignettes/biomaRt/inst/doc/biomaRt.html)。第4.11節標題爲「給定人類基因TP53,檢索該基因的人類染色體位置......」回答你的問題。 – neilfws

回答

2

我不完全知道你的基因位置的意思,但我認爲下面應該讓你開始:

ensembl <- useMart("ensembl") 
ensembl <- useDataset("hsapiens_gene_ensembl",mart=ensembl) 
getBM(attributes=c('chromosome_name', 'start_position', 'end_position', 'strand'), 
     filters=c('hgnc_symbol', 'ensembl_gene_id'), 
     values=list('TTN', 'ENSG00000155657'), 
     mart=ensembl) 

您可以輸入多個過濾器在這個例子中添加額外的載體(的長度爲二)到values列表。

您可以使用函數listAttributes(ensembl)來獲取data.frame,其中包含您可以從biomart獲取的所有屬性。

正如@neilfws已經指出的那樣,biomaRt user guide是尋找關於biomaRt的更多信息的正確地方。我建議您在Bioconductor support forum上詢問更多有關Bioconductor R軟件包如biomaRt的問題。

+0

謝謝!我一直在尋找這個解決方案。 – asdlfkjlkj