2010-10-08 101 views
1

我的實際問題是這個更普遍一些,但這裏是一個具體的例子。在籃球比賽中,你計算的罰球命中率是:預測籃球獲勝的可能性%

的罰球命中率(FT%)=自由拋出製造(FTM)/自由拋出嘗試(FTA)

我有兩個團隊,併爲每個我有團隊的FTM和FTA的均值和方差,因此我可以將每個模型作爲一個隨機正態變量(顯然FTM和FTA將相關)。例如,我可以很容易地計算出一個球隊比另一個球隊罰球更多的概率。

我的問題是...我怎樣才能找到一個團隊將拍攝比其他更高的罰球命中率的概率是多少?爲什麼這很難計算?有任何想法嗎?

在此先感謝! :-)

+1

這個問題可能會更適合於新的[統計stackexchange(http://stats.stackexchange.com/) – csgillespie 2010-10-08 09:16:07

回答

1

事實證明,正態分佈變量(例如FTA和FTM 在您的模型中)的比率以一種相當複雜的方式進行分佈!最簡單的(或者可能最不易處理的)情況是當兩個均值都是0時,在這種情況下,比率跟在Cauchy distribution之後。這種分佈很難處理,因爲代表均值和方差的積分沒有很好的定義。但FTA 和FTM有非零的手段,所以即使這是過分簡單化。所以我不認爲你會爲你想要計算的概率找到任何簡單的表達式。

另一種方式來看待它可能是:誰關心,如果數學是棘手的...只是 模擬它!執行N次試驗,對 產生合理分配的值各隊的FTM和FTA,然後跟蹤1. N多少次隊1具有更好的FT% 比團隊可能並不需要太大,這取決於如何準確 您估計需要......可以表明,估計比例的誤差變化爲1/sqrt(N)。

我也建議建模FTM比正態分佈以外的東西。具有參數n =平均值(FTA)和p =平均值(FTM)/平均值(FTA)的二項分佈似乎更適合。有了兩個正態分佈,FTM> FTA有一個非零概率,其中 沒有意義。

+0

不要將正常的變量需要有0,以平均他們的比例遵循柯西分佈?模擬的想法很有趣......雖然這裏的性能將是一個考慮因素。另外,我認爲你認爲二項分佈更適合FTM。感謝您的輸入! – Kenny 2010-10-08 05:30:36

+0

@Kenny:你說得對,我錯過了平均= 0的條件!在這種情況下,數學變得更糟。我會試着重新說一下我的答案。 – 2010-10-08 05:37:21

0
+0

真棒公式!有什麼辦法可以將這個應用於相關變量? – Kenny 2010-10-09 03:01:02

+0

我懷疑答案是否定的,如果允許任何形式的依賴。在這種情況下,我認爲你可以更仔細地嘗試和模擬這種情況,但結果很難分析。你有一個參數爲n,p(FTM)的二項變量,其中n = FTA是一個隨機變量,跟隨你所說的正態分佈。我認爲你不太可能找到這種分配的封閉表格。我在這裏http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2843591/找到了一篇相當簡潔的文章,但我沒有時間去嘗試和理解它。 – piccolbo 2010-10-09 05:10:06

+0

在這種情況下,我會模擬上述模型,然後使用興趣數量的自舉估計值(如果我低於和等於正確的話,兩支球隊的平均投籃差距)。在R模塊啓動將是非常有用的,以及rnorm和rbinom。唯一的問題是,我不同意在二項式中的p是平均值(FTM)/平均值(FTA),我認爲p本身是一個隨機變量,甚至取決於FTA。所以模擬不明顯,也許你沒有足夠的信息來執行它。 – piccolbo 2010-10-09 05:25:07