「アルファ碁ゼロ」

完全な教師なし学習で独自の定石を見付け、更に進化し、世界最強に



                                       2017年10月20日
                                               高野圭介

新登場AI囲碁  
世界最強の人間の棋士より強い囲碁の人工知能(AI)を開発した
英ディープマインド社が、さらに腕前を上げたAI「アルファ碁ゼロ」を開発した。

 囲碁世界一の伝説の棋士に勝った人工知能(AI)プログラム「アルファ碁」を
圧倒する新プログラムが登場したのである。




 またもや新しい世界を切り拓く

 
 従来のAI囲碁  
従来の囲碁AIはこれまで、人間の棋士の膨大な棋譜を学習した上で
AI同士が繰り返し対局する「強化学習」という手法で腕を磨いてきた。
2016年に韓国の李世乭九段を4勝1敗で下し、注目を集めたものだ。

AIアルファ碁ゼロ


 AI「アルファ碁ゼロ」は、棋譜のデータに頼らず、
人間の初心者以下の状態から強化学習だけで上達した。

40日間に2900万回(1日平均70万局)の自己対局の後、
李九段に勝ったAI「アルファ碁マスター」と対局して、100戦全勝した。

 


 


アルファ碁ゼロ vs アルファ碁 実戦譜。黒が打ちやすそうなので、アルファ碁ゼロの先番と推定した。
AIとAIの特徴がよく表れており、進歩の跡も診られる。まずは分かりやすい進行である。

 


上の棋譜は「アルファ碁ゼロvsアルファ碁」の実戦譜である。

左は9手まで、昭和初期に発表した呉清源の「新布石」に似ており、
碁盤の中原をお互いが打ち合って、掴み所が無い。まるで神様と打っているようだ。

呉清源が面白いことを言っている。

盤上の複数個の石の集団には、一個の石にはない協同性という力が生まれる。 

神様と首を賭けて打つのだったら、5子置いても打てないだろう。
また、神様と碁を打つと10手くらいで負けてしまう。


藤沢秀行の言葉は有名である。

「碁の神様がわかっているのが100だとしたら、
私にわかっているのは、せいぜい5か6か、あるいはもっと下です」

 

 

全く独自の世界  
この多層ニューラルネットワークと強化学習:ディープラーニングに
基づくこのAI囲碁は、囲碁のルールだけを教えるだけで碁を打った。,

人間の定石などのような訓練用のデータを用意しないで、
自分自身で独学して独自の「定石」も見つけ、強くなったものだ。

 2017年10月18日の英科学誌ネイチャーで発表する。

 


AIアルファ囲碁ゼロ 堂々登場した。