[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
5: 535 [sage] 2017/10/16(月) 23:09:26.31 ID:nZcg7vL7 名前はどうしましょうかね〜 新スレだし310,535を名乗るのもなんですね… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/5
114: 535 [sage] 2017/12/06(水) 00:45:59.31 ID:D/I5x6A8 メモリも山盛り積みたいですよね〜 GPGPUも考えられるし。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/114
296: 310 [sage] 2018/03/17(土) 02:14:23.31 ID:Foa7nGV6 なんとなく想像しただけですが、何が悪かったのかわかり始めました。 今の学習は「良い手」しか学習していないという事です。 序盤はある程度ランダムな着手を入れて、結果がばらつくようにしていますが、 途中から読みを入れて、良い手だけで着手し、その結果を遡りで訂正しています。 遡りが有効なのは30手くらいまでで、序盤のランダムは20手程度までに抑えて あります。とすると、遡れる範囲では、悪手を打ったらどういう事になるのかという 学習が抜けている。間違えた着手もちょっとだけ悪いだけでです。結果、最善手の 評価値はそこそこ正確なのですが、極端な悪手も、評価値としてはちょっとだけ 悪い数字でも問題が起きないという事になります。 これはこれで順序付けさえ合っていればそれで良いのですが、ちょっと学習が 進んで、微妙に係数が変わった時に、計算上0.1程度しか悪くない相当な悪手 をうっかり選択しやすくなってしまうという事で、これがオーダリングで悪さをして、 探索時間を長引かせてしまう可能性があります。 恐らく評価関数のステージ分割で、表現力がかなりアップした事から、こういう 学習漏れみたいな事が起きてくるのかなぁと。ほんと、評価関数はスカスカです。 というわけで、昨夜書いたように、ある程度深さを捨てて分岐をすべて記譜に残す ようにしてみようかなぁと思っています。しばらく記譜作成しながら、この事を踏まえ た強化学習をちょっと考えてみたいと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/296
302: 310 [sage] 2018/03/31(土) 01:38:59.31 ID:h3UgGfs1 ランダム着手も追加して記譜増殖中。ただいま32000超え。 もっとも、残り数手とかの記譜もあるけど(汗 ステージ分割しているので、記譜がなかなか生成されない25〜30手近辺で 非常に少ない教師データで何度も学習する事になり、そのあたりが極端な 過学習になってしまった。 解消方法をいくつか検討中です。 1)時間かかっても良いので、25〜30手の記譜ができるまで頑張る 2)前後の盤面を混ぜて、教師データを増やしてみる 3)ランダム強化学習してみる。 2)3)をやると、おそらく、平均化されて評価値がフラットになるが大小関係は 治ってくると思う。 というわけで、今夜は2)3)を試してみる予定。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/302
493: 535 [sage] 2018/11/17(土) 17:28:43.31 ID:s4ulT91Q うおお、ついに新PC買っちゃいました! http://s.kota2.net/1542443012.jpg http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/493
550: 310 [sage] 2018/12/18(火) 00:14:29.31 ID:4TPQUuZQ という問題もありながら、ノード数表示して、>>492さんの結果と比較すると、 ノード数に圧倒的な差が。NPSは速いけど、それ以上にノード数が多い。 枝刈の差というにはあまりに大きな差で、一桁近い差です。 これ、Iterativeな手法で生じる置換表探索の差じゃないかと思う。 自分のは置換表の動作が遅いので、あまり深い探索まで置換表を適用できず、 読切において後ろの方は置換表が無い(そもそも使用していない)事で、何度も 再探索しているからかなと。 concurrent_unordered_mapを使っているけど、自前でハッシュDB作った方が 良いかもと思い始めた。そこで速度アップすると、置換表適用深度を深くできる。 こういう時、自前で作る人はチェーンハッシュ使っているのかな? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/550
563: 535 [sage] 2018/12/26(水) 21:06:48.31 ID:2Tvqp++w 明日か明後日あたりで棋譜10万局分溜まりそう 深層学習のプログラム、組みたいなぁ でも難しいんだよなぁ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/563
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.080s