ニューラルネットワークで囲碁の終局を判定２ - 超ウィザード級ハッカーのたのしみ

前回

何パターンか試してみた。

入力値は、終局図から黒石を取り除いたものと白石を取り除いたものを並べたものである。石がある点を1.0、石がない点を0.0としている。黒石が1.0で白石が-1.0、石なしが0.0とすると石なしが白と黒の間という意味になってしまうので、冗長になってしまうがこうしている。

出力値は、活きている黒石および黒の地を1.0、そうでないところ（つまり白）を0.0とする。

教師データは1000局の終局状態とそれを回転させてたり反転させたりして得た7000のデータを合わせた8000点のデータである。

隠れ層の数が１でユニット数361
隠れ層の数が１でユニット数722
隠れ層の数が２でユニット数がそれぞれ361
隠れ層の数が３でユニット数がそれぞれ361 (2015-01-18追加）

の３4パターンを試した。

どこまで収束させるかはあんまり考えず時間が許す限りとした。1は500回、2は500回、3は1700回学習させた。

パターン１の結果

教師データに含んでいない1000局のデータをテストデータとした。

	教師データ	テストデータ
raw territory error rms	4.48	7.66
discretized territory error rms	4.84	8.57
raw error rms	23.06	65.47
discretized error mean	22.50	75.40

rawの意味は出力値そのままの値、discretizedの意味は出力値が0.5以上なら1.0、0.5未満なら0.0とした値である。territoryは出力値を足しあわせた値である。学習させるのは各点が黒か白かであるが気になるのは、その合計なので計算している。territoryとついていないのは各点の値である。

パターン２の結果