我是一名本科生,對遺傳算法在視頻遊戲中扮演的角色進行了非常基礎的研究。在YouTube上,有些人展示了他們如何使用這些算法教導電腦玩家如何玩的視頻。遺傳算法如何被用來促進機器學習?
http://www.youtube.com/watch?v=ofVKsxeYa6U&feature=related
我明白遺傳算法是最好使用的搜索算法,當你知道你想達到但不完全通用的解決方案。防爆。在TSP中,你知道你想找到最短路線或考試時間安排問題,你希望所有的學生都能夠以最少的「中斷」參加考試。在這些問題中,算法明確使用的問題。然而,我無法用g.a來理解「機器學習」的概念。
當遺傳算法被用來教計算機如何玩,他們如何「學習」? 他們怎麼學會玩遊戲? 他們試圖解決什麼是「優化問題」?
的最終目標是不會死的,打敗敵人或解決難題。背後的學習主要是強化學習,你告訴學習者什麼是錯誤的,慢慢地開始學習正確的方法。 BTW有他們的論文:http://twsandberg.dk/media/4615/playing%20mario%20using%20advanced%20ai%20techniques.pdf – 2012-08-06 14:30:46
感謝您的答案。 「我的最終目標是不死」和「強化學習」在我思考它是如何工作的時候會有很大的幫助。我試過閱讀這篇論文,但對我來說太過於技術了。我會再次嘗試慢慢剖析每個段落。 – 2012-08-10 10:36:51