我想通過R.關於如何通過R訪問谷歌網站管理員工具api的建議?
我從這裏看到訪問我的谷歌網站管理員的工具API:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
,它需要獲取背後HTTPS飼料和解析它。
有關如何做到這一點的任何建議?
我想通過R.關於如何通過R訪問谷歌網站管理員工具api的建議?
我從這裏看到訪問我的谷歌網站管理員的工具API:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
,它需要獲取背後HTTPS飼料和解析它。
有關如何做到這一點的任何建議?
我想你可以使用Java client和rJava。
嗨馬蒂,你能有點更具體 - 我不知道如何去做。 – 2010-10-14 15:50:51
對於java的一面,有一些例子http://code.google.com/intl/fi-FI/apis/webmastertools/docs/2.0/developers_guide_java.html,如何從rJava調用它我認爲你需要參考其文檔。我本人並不是Java程序員,但是有很多項目都成功地使用了rJava。 – 2010-10-14 16:53:08
RGoogleData源也可能爲您提供一些提示r-forge.r-project.org/projects/rgoogledata/ – 2010-10-14 17:41:57
基於一些谷歌搜索,我會說RCurl庫是你最好的HTTP的東西。他們有一個很好的例子來說明如何做一些基本的操作和使用XML有效載荷:http://www.omegahat.org/RCurl/xmlParse.html
與其他GData服務一樣,網站管理員工具api是基於AtomPub的XML。使用XML庫解析應該相當容易,但是您需要自己編寫代碼。
Brandon提到的Googleanalytics4r採用了相同的方法。看到:https://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R
它有點不好意思,但我通過發出system()命令,例如在這裏通過Python工具(http://code.google.com/p/webmaster-tools-downloads/source/browse/downloader.py)從R訪問來自R的GWT數據。
feedback <- system("python ./gwt-tool/googlewebmastertool_download_gmt.py")
其中「feedback」是從腳本生成的消息,並且這些文件出現在系統調用的工作目錄中。
一個更好的解決方案是使用httr包來製作請求(這是上面提到的RCurl的包裝) - 我發現httr能夠消除RCurl可以呈現的一些配置問題。
也許你可以從sorenmacbeth改編這段代碼http://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R – 2010-10-14 04:24:32
謝謝布蘭登,那是我的後備計劃 - 我想知道是否有其他人已經感動了這個話題。 – 2010-10-14 15:51:25