2013-04-22 75 views
0

我正在製作一個項目,我需要根據籃球運動員過去的統計數據來預測未來的統計數據。我希望能夠根據過去三個賽季的統計數據(如果有前三個賽季可供選擇)預測下賽季的統計數據。有沒有人有一個好的預測算法,我可以使用的建議?數據是連續的,並且可以有5-14維度(年齡,分鐘,點等)之間的任何地方籃球統計的預測算法

謝謝!

注:我真的很喜歡使用Weka程序來做到這一點。

回答

2

開箱即用,random forest可能會給你一個強大的基線,所以我會從這開始。

您也可以嘗試嘗試linear regression,這是一種簡單但相對有效的方法,但依賴於數據可能需要稍微調整一些(例如轉換一些輸入和/或輸出變量)。

Gradient boosting迴歸是另一個強大的預測指標,但通常還需要更多的調整才能正常工作。

所有這些算法都有Weka實現。

0

我推薦你懶惰KStar算法。

從在Pentaho維基摘自:「ķ * 是基於實例的分類器,其是類的測試實例是基於類類似於它的那些訓練實例,如由一些相似性的函數確定它不同於其他基於實例的學習者,因爲它使用基於熵的距離函數。「

0

顯然沒有一個正確的答案,但對於任何想要做類似事情的人來說,我會更好地描述我的問題以及我找到的解決方案。我創建了一個csv文件,每行都是不同的季節,每列都包含不同的屬性。對於我想要預測的每個屬性,我都有本賽季的統計數據,然後是上一季的統計數據。第一場(新秀賽季)對於所有'上賽季'的球隊都會有0。使用這個數據集,我將它加載到Weka中,並使用一個多層感知器,將測試選項設置爲交叉驗證。我將摺疊數設置在可用季節數的80-90%之間。

最後,爲了預測下一季的統計數據,您最後再添加一行,並輸入最後一個季節的值「?」在你想要預測的列中。如果有人想要更深入的例子,我會很高興提供一個。

+0

我對你如何預測屬性有點困惑。你能舉一個例子嗎? – 2015-11-10 22:11:53