要約

大学のiDSプログラムで、 Alpha Zeroのアルゴリズムを参考にしたリバーシアプリを作成した。 チームで作成したプロダクトで僕が担当したのは次の要素。

  • 機械学習モデルの実装・学習
  • APIの作成
  • Androidアプリの作成

構成

簡単な構成は以下の通り。 リバーシアプリの全体図

クライアント側から現在の盤面とCPUの手を送信すると、 サーバー側でCPUの手を計算して配置場所を返す仕組み。 Webアプリとしてブラウザ上でプレイすることができ、 同じAPIを使用したAndroidアプリからも 同様にプレイすることができる。

参考文献

AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門