2016-11-24 181 views
0

我想知道如何使用R腳本將駐留在hdfs中的.xlsx文件轉換爲.csv文件。當xlsx文件存在於hdfs中時,將xlsx文件轉換爲csv文件

我試過使用XLConnect和xlsx軟件包,但是它給了我錯誤「找不到文件」。我在使用上述軟件包的R腳本中提供HDFS位置作爲輸入。我能夠使用hdfs讀取.csv文件R腳本(read.csv())。

我是否需要安裝任何用於讀取hdfs中存在的.xlsx的新包。

分享我使用的代碼:

library(XLConnect) 

d1=readWorksheetFromFile(file='hadoop fs -cat hdfs://............../filename.xlsx', sheet=1) 

"Error: FileNotFoundException (Java): File 'filename.xlsx' could not be found - you may specify to automatically create the file if not existing."

我確信該文件存在於指定的位置。

希望我的問題很清楚。請提出解決方法。

在此先感謝!

+1

歡迎來到StackOverflow!請閱讀關於[如何提出一個好問題](http://stackoverflow.com/help/how-to-ask)以及如何給出[可重現的示例]的信息(http://stackoverflow.com/questions/ 5963269)。這會讓其他人更容易幫助你。 – Jaap

+0

錯誤很明顯。您不是以正確的方式引用文件。 –

回答

0

hadoop fs不是一個文件,而是一個命令,它將文件從HDFS複製到本地文件系統。從R外部運行此命令(或使用system從內部運行),然後打開電子表格。