2017-03-15 127 views
-5

我想在一張情節/圖表中顯示3種不同化妝品品牌和12個月總支出之間的客戶關係。但我不確定是否所有專欄都是正確的,因爲我從來沒有做過這種情節,所以請求幫助。劇情需要什麼數據? R

規劃R.

陰謀我想我問什麼是正確的列和我應該做的情節類型?

是我迄今爲止的欄目有:

CUSTOMER_ID,Brand_Name_Column,12MONTH_SALES

謝謝!

+1

一般來說,這個論壇是用於詢問R課題作爲一種編程語言。我們沒有足夠的信息來幫助你。我會建議在紙上畫出你想製作的情節,這將幫助你確定你需要製作情節的信息。 –

回答

1

如果您給出了plot函數1參數,它將會生成一維的barplot。

如果您給繪圖函數2個值(必須是數字),它會給它一個標準的橫軸與縱軸的代數圖。

如果您給繪圖函數3個值(2個數字和一個因子,則可以繪製點,但顏色外殼標記它們),然後使標籤對用戶顯而易見。

基於R的內置數據集 「橙色」,就可以作出這樣一個情節:

> View(Orange) 
> summary(Orange) 

情節(橙色$年齡,橙色$周長,山坳=彩虹(5)橙$樹(「topleft」,title =「Orange Trees」,fill = rainbow(5),levels(),pch = 16,main =「通過圓周相關樹齡」,grid(nx = 25,ny = 25)) Orange $ Tree))

注意:rainbow(5)?爲什麼是5?因爲列樹有1-5個因子。由於你有3個不同的化妝品品牌,你應該做彩虹(3)。

這就是你如何得到一個線性迴歸線,如果它的工作。你必須使用線性模型(LM)功能:

> model <- lm(Orange$circumference ~ Orange$age) 
> summary(model) 
> abline(model) 

Plot Function with grid and regression line

您也可以在格子庫使用xyplot。

> library(xyplot) 
> xyplot(circumference ~ age| Tree, data = Orange, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees") 

xyplot 3 variable plot

我沒有顏色的外套我的觀點,但我也沒必要。雖然我喜歡這個情節,但我認爲使用情節函數進行顏色塗布對於進行統計判斷更好,因爲它將所有因素放在同一個圖中。

問題:這些功能如何工作等?

>?plot 
>?xyplot 
>?Orange 

scatterplot3d函數也很酷。您可以用它製作三維圖,但您如何判斷相關性受到您設置視圖的「角度」的影響。

而且您還可以使用xyplot函數來製作更酷的圖形。每個因子有多條迴歸線。

>xyplot(circumference ~ age, data = Orange, groups = Tree, type = c("p", "g", "r"), main = "Plots of Orange Age vs Circumference for 5 Orange Trees", pch = 16, auto.key = TRUE) 

enter image description here

我與我的使用auto.key命令的傳說是非常可怕的。它可以改善,我敢肯定!

如果您想繪製兩個變量:一個數值變量和一個因子變量,您可以這樣做:使用tapply函數。在這裏,我使用tapply函數來計算每棵樹的所有周長。然後你使用barplot功能。這可能是你想到的。

> sum_table <- tapply(Orange$circumference, Orange$Tree, FUN = sum) 
> sum_table <- sort.default(sum_table, decreasing = TRUE, na.last = NA) 
> barplot(sum_table, xlab = "Trees", ylab = "Circumference", main = "Sum of Circumferences for all 5 Orange Trees", col = "dodgerblue1")) 

barplot_of_sums

好的,當一個數值變量與另一個因素變量中列出沒關係積函數默認爲使盒形圖。

> plot(Orange$Tree, Orange$circumference, main = "Boxplots of Orange Circumference vs Orange Trees", xlab = "Orange Trees", ylab = "Circumference") 

Wow! Rplot makes barplots

+0

可以製作更多類型的地塊,熱圖,鑲嵌圖和直方圖覆蓋變量的正態分佈!這非常令人興奮。使用tapply函數表明你不必重新組織你的數據框,只需做一個小小的切口即可。 – xyz123