2011-12-26 89 views
3

Summary編程技術來檢測趨勢歷史的體育比賽數據

我一直在尋找使用與必發賠率的眼睛,看看是否是爲了更好地預測未來的比賽結果的機會的歷史澳大利亞人規則的結果。我的最新進展在背景下面有更詳細的介紹。

我現在想更進一步,看看我可能實現的數據挖掘/模式匹配/算法技術。我曾與在Excel中使用動態模型(擴展),並使用解算器優化了一定的經驗,但我不熟悉數據挖掘其他比這個詞本身

是否有可行的數據挖掘程序提供給我來部署技術這在VBA中的分析?

(我知道這個問題可能被一些人視爲邊緣,但我認爲Stack Overflow更適合於這個問題,不如說是Math - 我很希望知道我可以在VBA應用潛力編程選項/ algorithims)

我的強烈偏好是用VBA \ VBscript來看這個,因爲這是我的編碼背景,但如果它們明顯更好,我願意接受其他選擇。

Background

我已經提取在過去的幾年到Excel澳大利亞足球規則中的數據。這個數據給了我:

  1. 逐季結果
    (例如WWWL意味着球隊1根引線前三quartes輸掉本場比賽之前,源DLL1意味着球隊1和2在第一年底進行了水平四分之一,然後隊伍2領先於剩下的比賽)。
  2. 同樣的信息由半重組爲上半年業績
  3. 主客場的球隊(1隊是主場,球隊2客場)
  4. 比賽日球場
  5. 一年中的月份

然後我匹配其他數據集,如

  1. 聯賽階梯按周(已完成)
  2. 無論球場是露天或封閉(完成)
  3. 莊家賠率預遊戲(做)
  4. 什麼用的露天體育場的天氣條件下發生的(做)

然後骰子與PivotTables(可能的PowerPivot)拼接詢問這些數據來尋找遊戲的機會,例如:

  • 做某些球隊的團隊從開始到導致完成(WWWW)往往比別人,做賠率一個「四分之一」的勝利(WWWW)付出不成比例地高於這個 可能性更將表明香草勝利(所以香草取勝,回到的WWWW)
  • 尋找在首頁標明差異客場表現(即家庭地面知識或家庭支持導致更多的¾次分數逆轉)
  • 露天與封閉屋頂體育場的比較結果(去除天氣影響)
  • 長途旅行一週是否會影響下一個星期本週(S)的結果
  • 做某些球隊產生一定的計分方式往往比標準的聯賽成績
  • 是一個排名較低的球隊更有可能貫穿整個比賽引比後來居上擊敗排名較高的球隊
+0

我知道這並不能解決您的問題,但我相信這可能會有幫助。當我進行數據挖掘課程時,我們使用了Weka(http://www.cs.waikato.ac.nz/ml/weka/) - 它有相當多的數據分析算法,您可以直接從那裏使用它們,或者將它們調整爲Java代碼(如果您碰巧知道如何編程Java ..):) – Nobita 2011-12-26 09:16:41

+1

您當然可以在VBA中執行此類操作。但是你需要自己去做,因爲科學界沒有人使用Excel。流行的工具包括R,Matlab和Weka(這是一個Java應用程序) – 2011-12-26 10:37:30

+0

@ Anony-Mousse根據我的文章,我會考慮除了Excel以外的其他工具,但我的主要興趣是如何分析我的數據集的趨勢,例外等 – brettdj 2011-12-30 02:24:45

回答

2

查看快速礦工,它有一些內置的工具來探索你的數據。假設你有能力勝任計算機工具,也可以看看Weka這是一個機器學習工具。如果您對數據進行了註釋,則可以對數據進行算法訓練,並查看預測勝出者的最準確的數據。

例如 A隊踢B隊,你基本上必須在csv文件中表示比賽的流程,在同一線上也可以表示任何附加的統計數據,然後在最後一個選項卡上說明哪支球隊獲勝。你說哪支球隊獲勝的部分就是訓練過的東西。

+0

謝謝史蒂夫 - 我會研究這個(+1爲你的迴應)。我會再等一會兒,看看我是否得到了進一步的答覆 – brettdj 2012-01-04 09:57:13

1

這篇文章有點晚了,但只是想在流程本身上添加2美分。我的結論是,預測一個事件發生(返回)或不發生(發生)的概率是沒有用的。我的結論是,預測事件發生(返回)或不發生(發生)的概率是沒有用的。問題在於,即使您能夠以較高的準確率清晰地識別出趨勢,但由於市場可能性,您仍然無法從預測中獲利。機率有效地將概率回覆到50/50。事實上,市場可能性本身會告訴你事件發生的隱含可能性。

引伸概率(%)=(1 /(比值 - 1))

例如:如果背繪圖是4.1;這實際上意味着抽籤的機率爲32.25%。

爲了從必發有效獲利,需要查看市場機率的差異,而不是查看事件發生的概率。例如:由於市場出現快速波動的情況,可能(短暫地)出現跨市場機率傾向於提供> 100%回報的情況。這在主要比賽中不會發生。主要是在低音量的比賽中。

+0

p/s:如果您正在爲此目的培訓一個神經網絡(人工智能),一定要包括該交易的賠率和利潤/損失作爲因子;否則,您可能會遇到可能會準確預測結果的情況,但仍會損失資金。好lukc! – 2012-12-29 20:00:53