2015年07月04日

麻雀AIの個性とは?学習のフィードバック手法とと抽象化の工夫か?

麻雀AIを作ったことのある人って結構沢山いるんですね。

そういえば私も高校生くらいの時に少しだけ作ってみたことがあったような気がします。

多分ほとんどの人は、思考ルーチンの調整方法は手作業だと思いますが、調整方法=対戦結果を思考ルーチンへフィードバックする方法に機械学習の手法を採用している方はどれくらいいらっしゃいますか?

思考ルーチンの個性というか分類ということを考えると、麻雀を抽象化する方法の工夫と、機械学習のフィードバックの方法、というのが大きな区分になるのかなと思っています。

フィードバックが手作業というアプローチもあると思いますが、適応的であって自律的に調整するような方法が麻雀には合っているような気がします。

あとフィードバックも局単位試合単位とかではなくて適当な粒度で確率的にとかできたらいいなと想像したりしています。

楽しい議論ができるといいですね。
posted by つの at 21:21| 日記
■返信を希望する場合にはこちらからお問い合わせ下さい。

■雀荘戦ルールについて■
場千五(1本場1500点)を採用しています
東西場を採用しています(西も場風)