2016-06-21 95 views
0

離開了我試圖通過下面的代碼中的R在線閱讀JSON數據爲R:數據在線閱讀JSON時至R

library('jsonlite') 

address<-'https://data.cityofchicago.org/resource/qnmj-8ku6.json' 

sample<-fromJSON(address) 

的代碼並運行,並在表格的格式正確的結果。但僅產生了1000個觀測數據,而原始城市門戶網站數據庫有20多萬個觀測數據。我不確定要下載整個數據集的內容。請幫忙。

+0

確定嗎?轉到「https:// data.cityofchicago.org/resource/qnmj-8ku6.json」頁面,滾動到末尾並查看「id」字段(9909096)。然後看看'tail(sample)'''id'字段(9909096) – SymbolixAU

+0

「原始城市門戶網站數據庫」的鏈接是什麼?原始網站: – SymbolixAU

+0

:https://data.cityofchicago.org/Public-Safety/Crimes-2014/qnmj-8ku6 – lnx

回答

0

您正在使用錯誤的鏈接來獲取數據。您可以通過訪問「導出」

library(jsonlite) 

address <- "https://data.cityofchicago.org/api/views/qnmj-8ku6/rows.json?accessType=DOWNLOAD" 
sample <- fromJSON(address) 

length(sample) 
# [1] 

length(sample[[2]]) 
# [1] 274228 

雖然看到了正確的鏈接,你可能想要得到它爲.csv,使其更易於使用直線距離?

address <- "https://data.cityofchicago.org/api/views/qnmj-8ku6/rows.csv?accessType=DOWNLOAD" 
sample_csv <- read.csv(address) 

nrow(sample_csv) 
# [1] 274228 

str(sample_csv) 
# 'data.frame': 274228 obs. of 22 variables: 
# $ ID     : int 10512552 10517063 10517120 10518590 10518648 
# $ Case.Number   : Factor w/ 274219 levels "HA107183","HA156050",.. 
# $ Date    : Factor w/ 112977 levels "01/01/2014 01:00:00 AM",.. 
# $ Block    : Factor w/ 27499 levels "0000X E 100TH PL",.. 
# $ IUCR    : Factor w/ 331 levels "0110","0141",.. 
# $ Primary.Type  : Factor w/ 33 levels "ARSON","ASSAULT",.. 
# $ Description   : Factor w/ 310 levels "$500 AND UNDER",.. 
# ... etc