我想繪製數據,使得在y軸上會出現概率(範圍[0,1]),在x軸上我具有數據值。數據是連續的(範圍[0,1]),因此我想使用一些核密度估計函數並對其進行歸一化,使得某個點x處的y值意味着在輸入中看到x值的概率數據。使用ggplot2繪製概率(不是密度)
所以,我想問問:
a)它是否合理?我知道我無法看到數據中沒有的值的概率,但我想插入點之間的內核密度估計函數,然後對其進行歸一化。
b)我可以使用ggplot中的任何內置選項,它會覆蓋geom_density()的默認行爲,例如爲了做到這一點?
由於提前,
蒂莫
編輯: 當我說 「正常化」 之前,我其實是 「規模」。但我得到了答案,所以非常感謝大家澄清我的想法。
我不確定你的繪圖概率是什麼意思,但「不是密度」,但你提到想讓內核平滑數據。內核做的是將經驗分佈(即直方圖)變成平滑密度函數(即PDF)。我認爲你必須放棄內核更流暢的要求,或者不打算密度的願望。雖然你可能會在你說「之後使其正常化」時解決這個問題。 – 2011-02-17 19:02:39
謝謝你澄清我的想法。我認爲在這種情況下,僅使用直方圖更合適。如果我試圖用平滑來繪製概率,我想我會混淆任何試圖解釋這些情節的人。 – Timo 2011-02-17 20:12:52