前回
ニューラルネットワークで囲碁の終局を判定 - 超ウィザード級ハッカーのたのしみ
何パターンか試してみた。
入力値は、終局図から黒石を取り除いたものと白石を取り除いたものを並べたものである。石がある点を1.0、石がない点を0.0としている。黒石が1.0で白石が-1.0、石なしが0.0とすると石なしが白と黒の間という意味になってしまうので、冗長になってしまうがこうしている。
出力値は、活きている黒石および黒の地を1.0、そうでないところ(つまり白)を0.0とする。
教師データは1000局の終局状態とそれを回転させてたり反転させたりして得た7000のデータを合わせた8000点のデータである。
- 隠れ層の数が1でユニット数361
- 隠れ層の数が1でユニット数722
- 隠れ層の数が2でユニット数がそれぞれ361
- 隠れ層の数が3でユニット数がそれぞれ361 (2015-01-18追加)
の34パターンを試した。
どこまで収束させるかはあんまり考えず時間が許す限りとした。1は500回、2は500回、3は1700回学習させた。
パターン1の結果
教師データに含んでいない1000局のデータをテストデータとした。
教師データ | テストデータ | |
---|---|---|
raw territory error rms | 4.48 | 7.66 |
discretized territory error rms | 4.84 | 8.57 |
raw error rms | 23.06 | 65.47 |
discretized error mean | 22.50 | 75.40 |
rawの意味は出力値そのままの値、discretizedの意味は出力値が0.5以上なら1.0、0.5未満なら0.0とした値である。territoryは出力値を足しあわせた値である。学習させるのは各点が黒か白かであるが気になるのは、その合計なので計算している。territoryとついていないのは各点の値である。
パターン2の結果
教師データ | テストデータ | |
---|---|---|
raw territory error rms | 3.12 | 6.84 |
discretized territory error rms | 3.08 | 7.43 |
raw error rms | 10.01 | 50.08 |
discretized error mean | 9.24 | 55.39 |
パターン3の結果
教師データ | テストデータ | |
---|---|---|
raw territory error rms | 5.23 | 8.55 |
discretized territory error rms | 6.08 | 9.81 |
raw error rms | 35.13 | 96.11 |
discretized error mean | 39.52 | 110.13 |
どれも過学習の傾向にある。特にパターン2はダメだ。パターン3は層が多いためか、学習が遅くて困る。データ点数が少ないのかそもそも無理なのか。
データ数を増やして、もう少し他のパターンを試して見ようと思う。
PyBrainというライブラリを使ったが遅いので、FANNを使ってみる。*1しかし、FANNをPythonから使うライブラリがいけていないので、自分で作っているところ。
2014-01-18 追記
パターン4の結果
教師データ | テストデータ | |
---|---|---|
raw territory error rms | 5.81 | 7.64 |
discretized territory error rms | 8.00 | 10.35 |
raw error rms | 57.18 | 106.81 |
discretized error mean | 68.60 | 130.49 |
隠れ層の数を増やしたら、過学習の傾向は少なくなったように見える。しかし、計算資源の都合上、これ以上に隠れ層は増やせそうにない。
- 作者: C.M.ビショップ,元田浩,栗田多喜夫,樋口知之,松本裕治,村田昇
- 出版社/メーカー: 丸善出版
- 発売日: 2012/04/05
- メディア: 単行本(ソフトカバー)
- 購入: 6人 クリック: 33回
- この商品を含むブログ (17件) を見る
*1:PyBrainをC化したライブラリもあるみたいだが、怪しそうなので使わない