2016-09-19 51 views
0

所以「RetailSales2014」包含貨幣價值。我知道我需要刪除逗號來執行統計分析,但我是否也需要刪除前導'$'符號?如果我這樣做,我將如何刪除它們?如何獲得「RetailSales2014」列的統計信息?

# Load packages 

庫( 「XML」) 庫( 「RCurl」)

指定URL

網址< - 「https://nrf.com/2015/top100-table

下載URL的內容

url_content < - getURL(url)

解析HTML/XML內容以產生表示HTML/XML樹的R結構

DOC < - htmlParse(url_content)

表< - readHTMLTable(DOC)

轉換的第三元件列表中的數據幀

retailer_df < - data.frame(表)

屬性(retailer_df)

重命名retailer_df列

colnames(retailer_df)< - C( 「等級」, 「公司」, 「總部」, 「RetailSales2014」, 「USASalesGrowth」, 「WorldwideRetailSales」, 「USAPercentageOfWorldwideSales」, 「Stores2014」 , 「保增長」)

摘要(retailer_df)

寫零售商的數據爲csv文件的工作目錄下

write.csv(retailer_df,文件= 「top100retailers2015.csv」)

回答

0
retailer_df$RetailSales2014 <- 
    as.numeric(gsub("(\\D)", "", retailer_df$RetailSales2014)) 
+0

工作正常!我們的教授將教我們如何在本週晚些時候這樣做,但我想在理解數字轉換方面取得先機。 – user6794408

+0

等等...我幫你做了功課嗎? SMH。 – AidanGawronski

+0

否。該作業已使用我提供的代碼完成。其中一個問題是「顯示數據集的彙總統計數據,您是否獲得RetailSales2014變量的最小,中位數,平均值和最大值?爲什麼?將答案放在下面的框中。」這是確切的措辭。我不是作弊,坦率地說,我認爲這個社區對試圖學習R的學生不是很歡迎.... – user6794408