ニューラルネットワークと遺伝的アルゴリズムの組み合わせにより、ゲーム「スーパーマリオブラザーズ」の一面を教師無し学習で解かせている動画です。
最初に学習が十分済んだ状態のプレイが実演されますが、1面を46秒で解いています。世の中には41秒で解いてる動画もあるようですが、かなり早い部類と言えるでしょう。
0:46 からは、今回の解法についての解説です。マリオを含む画面上の地形やキャラクターのスプライトを入力に、どのボタンを押すかを出力としたニューラルネットワークをランダムに作り、うまくいったネットワークを組み合わせて次の世代のネットワークを作り試行させます。これを繰り返し、この例では34世代目でマリオが46秒でゴールに到達する組み合わせが出来ています。
luaのソースコードがPastebinで公開されているので、追試も可能かもしれません。NESエミュレーター(Bizhawk Emulator)とマリオ本体が必要だと思いますが。
SethBling さんは、マインクラフトなどゲームを扱った多数のヒット動画を持つ人気ユーチューバーでもあり、今は抜かれました(この記事執筆次点で歴代9位)がスーパーマリオの早解きで世界一を取ったこともあります。もしかすると早解きのルートはこのようなプログラムの解析を参考にしたのかもしれません。
# あるいはその早解きプレイ動画自体がこうしたプログラムによるものだった可能性もあるのかも
via TNW
「MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き」への12件の返信
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ http://t.co/5VDrsMO9ec
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き http://t.co/PrYHGa3LKD via @akky
【はてブ新着IT】 MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ http://t.co/tmc0dN8SQM
“MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ” http://t.co/yM1BHqg8sW
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き http://t.co/vtCDxmWhkD
” ニューラルネットワークと遺伝的アルゴリズムの組み合わせにより、ゲーム「スーパーマリオブラザーズ」の一面を教師無し学習で解かせている動画です。 “
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ http://t.co/V0pN7A6oo9
“MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ” http://t.co/O2rk5quACn
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ:… http://t.co/24GYBoVekN [ml]
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き | 秋元@サイボウズラボ・プログラマー・ブログ
http://t.co/bPHVOcr3M5
やろうと思ってたけど、既にやってる人が居た。。。
> MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き http://t.co/j9RCMQbRsM
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き http://t.co/CutZUrSGO7 @akkyさんから
MarI/O – ニューラルネットワークと遺伝的アルゴリズムでマリオの早解き http://t.co/8lBVy9RBNd