2011-05-09 58 views
1

更新:答案中的鏈接既有趣又有用,但不幸的是沒有解決對java API的需求,所以我仍然期待着任何輸入。有沒有人使用過pubchemdb?任何類似的API?

我正在構建化合物數據庫。我需要所有的同義詞(IUPAC和通用名稱)以及每個的安全數據。
我將使用在PubChem數據庫免費提供的數據(http://pubchem.ncbi.nlm.nih.gov/)

有簡單的HTTP查詢得到每種化合物的一種簡單的方法。例如,爲了獲得甘油數據,網址是:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753 

而下面的URL將返回一個簡單的解析格式:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF 

但它將只響應非常基本的信息,缺乏安全性數據只有少數常用名字。

JAVA有一個公共領域的API,看起來非常完整,由Scripps(citation)的一個小組開發。代碼是here

不幸的是,這個API沒有很好的文檔記錄,並且由於所涉及的數據的複雜性而很難遵循。 對於我所收集的內容,pubchemdb正在使用PubChem Power User Gateway (PUG) XML API

有沒有人使用過此API(或任何其他可用的)?我希望有一個關於如何開始的簡短說明或教程。

+0

這可能是StackOverflow的專家。有沒有可以嘗試的化學信息學社區? – 2011-05-09 20:21:42

+0

@Tom它可能相當專業,但我希望有人在這裏使用這些數據庫。這裏回答了很多ncbi問題。我也可以直接與作者聯繫。 – Aleadam 2011-05-09 23:13:11

+0

嗯,我生活和學習! – 2011-05-11 10:17:15

回答

2

Cactvs Chemoinformatics toolkit(免費用於學術/教育用途)已全面PubChem集成。使用腳本環境,你可以輕鬆地做類似

 
cactvs>ens create 753 

ens0 

cactvs>ens get ens0 E_NAMESET 

PROPANE-1,2,3-TRIOL GLYCEROL 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {Glycerin, natural} NCGC00090950-03 191612_ALDRICH 15524_RIEDEL {Glycerol solution} L-glycerol 49767_FLUKA {Biodiesel impurity} 49770_FLUKA 49771_FLUKA NCGC00090950-01 49927_FLUKA Glycerol-Gelatine G7757_SIAL GOL D-glycerol G9012_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U_SUPELCO {Glycerin, concentrated (JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {Glycerin, concentrated} 33224_RIEDEL Bulbold Cristal Glyceol G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,3-trihydroxypropane 1,2,3-trihydroxypropanol glycerin G2289_SIAL G9406_SIGMA {Glycerol-[2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 Technical glycerine} Dagralax {Glycerin, anhydrous} {Glycerin, synthetic} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01-00-02751 (Beilstein Handbook Reference)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei [German]} {EINECS 200-289-5} {EPA Pesticide Chemical Code 063507} {FEMA No. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {Glycerin (mist)} {Glycerin [JAN]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum [INN-Latin]} Grocolene {HSDB 492} IFP {Incorporation factor} 1,2,3-Propanetriol C00116 Optim {Propanetriol (VAN)} {1,2,3-PROPANETRIOL, HOMOPOLYMER} {Glycerol polymer} {Glycerol, polymers} {HL 80} {PGL 300} {PGL 500} {PGL 700} Polyglycerin Polyglycerine Polyglycerol {Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024 

cactvs> 

這個隱藏所有PUG醜 - 但在任何情況下,我敢說,PUG 有據可查。該工具包遠不止簡單的數據下載 - 如果需要,甚至可以打開PubChem並像本地SD文件一樣查詢。

PubChem不包含安全數據,但。安全性數據依賴於國家/地區,嚴格管制,您應該非常小心,不要受到責任。請法務人員檢查您的方法!

+0

謝謝你的回覆。我下載了cactvs pdf文檔,我會繼續。它看起來很有趣。 – Aleadam 2011-05-10 21:40:09

相關問題