2014-09-01 114 views
-1

我有一個網球比賽列表,其中包括時間,場地,表面,贏家/輸家的排名,贏家/輸家的比賽等信息。我打算用這些信息訓練一個MLP網絡(使用PyBrain)並將其映射到單個輸出 - 如果第一個玩家是贏家,則爲1.0,否則爲0.0。目標是預測未來的匹配(其中一些輸入未定義)。網球比賽人工神經網絡的輸入表示

每個玩家都由一個整數標識。有超過100名球員。我想知道我是否可以用這些整數直接表示球員,如果我應該使用小數(即除以100)還是我應該使用二進制表示?這很重要嗎?

回答

1

我不太確定球員號碼是如何表示的。

我假設神經網絡將在時間,場地,表面,排名等方面接受培訓,而不是玩家號碼,所以玩家ID很可能獨立於算法。

這聽起來像你有一個數據結構,其中包含的球員和他們的歷史業績和排名,以及比賽時間表。所以玩家和時間表信息很可能會作爲神經網絡的參數輸入,但是玩家ID將是一個管理評估過程的外部參數。如果這是真的,那麼這是如何實現取決於你的評估算法,而不是神經網絡。

+0

謝謝。我認爲玩家ID可能會影響結果,通過讓網絡代表哪些玩家早先擊敗了誰。但也許這不是一個好主意,我應該只使用比賽統計數據 - 看起來就像在類似場景中完成的那樣。 – 2014-09-02 22:13:21