2017-03-07 86 views
0

算法,擊敗*紐約時報'人工智能沒有蠻力強迫在岩石/紙/剪刀? (在老兵模式)算法,擊敗這紐約時報「岩石/紙/剪刀AI

http://www.nytimes.com/interactive/science/rock-paper-scissors.html?_r=1& (必須啓用Flash與AI玩)(網站不斷地給出了AI如何選擇下一步的行動,你參加了至少5次後的信息)

我學習機我自己學習,我很新手。 (剛剛開始昨天)。

我的朋友告訴我,他們被分配到解決上述問題,而不需要學習ML課程中的任何ML技術。我也想這樣做,但除了暴力強迫之外,我想不出其他任何方式。

對於訓練數據集玩AI100或更多時間並收集這些100或更多的數據。使用此數據創建算法,以便在使用程序時贏得更多遊戲而不使用程序。作爲一名超級新手,我根本想不出什麼。

任何提示? 感謝

回答

0

新手模式

因此該網站的好處是,是,它給出了這個概念背後的一舉一動。它試圖通過查看你的動作歷史來預測你的動作。 所以,你的移動歷史可能是以下幾點: (石= R,剪刀= S和紙= P)

r p s p p s s r r p s 

現在看起來透過歷史,並試圖找到r p s復發。它在歷史開始時發現r p s p p s s r r p s,並且發現你之後玩過p。因此計算機的下一步將是s

如果找不到字符串的重複發生(r p s),它會查看較小的字符串(p s)等等。如果它發現多次復發,挑選最多復發的那個(或者甚至只是隨機選擇一個)。

所以你可以編寫一個程序,它和網站上的完全一樣。你試圖預測你自己的舉動(如網站的程序)。因此例如(r p s),計算機會預測移動p,因此有了這些知識,您可以選擇s

老將模式

在老兵模式AI使用20萬個遊戲的歷史來預測你的下一步行動。因此,要嘗試打敗你,將以與AI完全相同的方式使用100場比賽的歷史。

您可以查看當前嘗試的歷史記錄(100場比賽),並嘗試查找某種類型的重複(例如r s p r)。你看看電腦的反應是什麼。現在你選擇相應的東西,以便打敗電腦。當然這不會總是贏,因爲計算機經常在兩次選擇之間使用隨機化的響應(以及更長的歷史,所以更多的樣本可供選擇)。但是這應該會增加你獲得的勝利。

我也沒有任何機器學習的經驗,但這是我編寫程序的策略。

我希望這會有所幫助。

如果你不能打敗他們加入他們的行列;) 乾杯

+0

謝謝回答所以,你告訴我操縱AI,但有一個問題。由於AI已經在內存中保存了200,000多個節目,AI不會從我身上學到很多東西,甚至會被我操縱。你說的東西會有用如果我玩的是一個新手AI,它從我身上學到了一切,但在這種情況下,我們正在玩一個已經保存了200,000場戲的老牌AI。 – Rikenm

+0

比你用100個遊戲作爲歷史來預測結果。 AI也會這樣做。再次使用Ai在網站上使用的想法。 –

+0

我已經更新了我的答案@Rikenm –