2010-10-12 60 views
6

我想通過R.關於如何通過R訪問谷歌網站管理員工具api的建議?

我從這裏看到訪問我的谷歌網站管理員的工具API:

http://code.google.com/apis/webmastertools/docs/2.0/reference.html

,它需要獲取背後HTTPS飼料和解析它。

有關如何做到這一點的任何建議?

+0

也許你可以從sorenmacbeth改編這段代碼http://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R – 2010-10-14 04:24:32

+0

謝謝布蘭登,那是我的後備計劃 - 我想知道是否有其他人已經感動了這個話題。 – 2010-10-14 15:51:25

回答

0

我想你可以使用Java clientrJava

+0

嗨馬蒂,你能有點更具體 - 我不知道如何去做。 – 2010-10-14 15:50:51

+0

對於java的一面,有一些例子http://code.google.com/intl/fi-FI/apis/webmastertools/docs/2.0/developers_guide_java.html,如何從rJava調用它我認爲你需要參考其文檔。我本人並不是Java程序員,但是有很多項目都成功地使用了rJava。 – 2010-10-14 16:53:08

+1

RGoogleData源也可能爲您提供一些提示r-forge.r-project.org/projects/rgoogledata/ – 2010-10-14 17:41:57

2

基於一些谷歌搜索,我會說RCurl庫是你最好的HTTP的東西。他們有一個很好的例子來說明如何做一些基本的操作和使用XML有效載荷:http://www.omegahat.org/RCurl/xmlParse.html

與其他GData服務一樣,網站管理員工具api是基於AtomPub的XML。使用XML庫解析應該相當容易,但是您需要自己編寫代碼。

Brandon提到的Googleanalytics4r採用了相同的方法。看到:https://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R

0

它有點不好意思,但我通過發出system()命令,例如在這裏通過Python工具(http://code.google.com/p/webmaster-tools-downloads/source/browse/downloader.py)從R訪問來自R的GWT數據。

feedback <- system("python ./gwt-tool/googlewebmastertool_download_gmt.py") 

其中「feedback」是從腳本生成的消息,並且這些文件出現在系統調用的工作目錄中。

一個更好的解決方案是使用httr包來製作請求(這是上面提到的RCurl的包裝) - 我發現httr能夠消除RCurl可以呈現的一些配置問題。

相關問題