2016-07-27 55 views
0

我知道在這個主題上有很多帖子,我通常能夠完成我想要的東西,但我在這個特定鏈接中遇到了麻煩。這很可能與excel文件的非正統佈局有關。這是我的工作流程:從鏈接下載xlsx並導入到r

library(rest) 
url<-"http://irandataportal.syr.edu/wp-content/uploads/3.-economic-participation-and-unemployment-rates-for-populationa-aged-10-and-overa-by-ostan-province-1380-1384-2001-2005.xlsx" 
unemp <- url %>% 
    read.xls() 

產生錯誤Error in getinfo.shape(fn) : Error opening SHP file

問題是不相關的數據的抓取。將數據導入可用格式方面出現問題。例如,read.xls("file.path/file.csv")會產生相同的錯誤。

+0

查看幫助頁'?download.file' – shayaa

回答

0

添加fileEncoding="latin1"解決了我的問題的選項。

url<-"http://irandataportal.syr.edu/wp-content/uploads/3.-economic-participation-and-unemployment-rates-for-populationa-aged-10-and-overa-by-ostan-province-1380-1384-2001-2005.xlsx" 
unemp <- url %>% 
    read.xls(fileEncoding="latin1") 
0

例如:

library(RCurl) 
download.file(url, destfile = "./file.xlsx") 

使用自己喜歡的閱讀器,然後,

+0

我知道如何下載文件,我說的是我無法導入這個特定的文件。即使我使用任何優秀的老「讀者」都可以保存它,但它不會導入。這就是爲什麼我提供可重複的數據! –

+1

如何在xlsx庫中使用'read.xlsx'? – kitman0804

+0

我可以用''read.xlsx''導入它,但是它以我沒有預料到的方式格式化。也許數據必須在Excel中手動處理。希望避免這種情況。但謝謝你的建議@ kitman0804 –