[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
408: 名前は開発中のものです。 [sage] 2016/02/29(月) 19:34:26.59 ID:etqtABZA 好きな言語 C++ C# Ruby 嫌いな言語 Java Python Perl http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/408
497: 310 [sage] 2016/08/22(月) 02:41:50.59 ID:2ubnBUwd Kが余計で3桁間違えているんじゃないかと(汗 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/497
553: 460 [sage] 2016/09/16(金) 13:50:57.59 ID:gJ0b6G2+ 自己対局での棋譜生成ですが、10手読みだとまだまだ精度が落ちるようで、思いきって中盤16手読みの24手読みにしてみたところ…10分で35局…w 今日は出勤時間がせまっていたのもありこのままで生成していますが、 中盤14手読みか12手読み、22マス空き完全読みにした方が良さそうです。 ああ、PC10台くらい並べて棋譜生成したい… http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/553
632: 535 [sage] 2016/10/27(木) 22:26:16.59 ID:CgNWWTgQ LV2からも黒番で一本取りました。 キセキが起きたw (;SZ[19] ;B[jj];W[ik];B[ji];W[hj];B[jh];W[jk];B[kk];W[jl] ;B[gi];W[il];B[ll];W[hm];B[ii];W[hh];B[hi];W[ki] ;B[mm];W[nn];B[li];W[in];B[kh];W[fi];B[mi];W[io] ;B[kj];W[lj];B[ki]) http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/632
713: 310 [sage] 2017/01/31(火) 01:17:50.59 ID:tF0OU/RM 困った。3層MLPで次の1手を、 http://qiita.com/kanlkan/items/6bff417519ed7d5ce4da を参考にして求めている(若干やり方が違う)のだけど、思ったように学習してくれない。 NNの計算どっかおかしい気がしてきたorz http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/713
787: 310 [sage] 2017/04/05(水) 01:14:25.59 ID:4SaLkpgr >>786 Zebraが間違えたのは14手目のB5だった模様。ここで引き分け手順から外れてます。 定石無しにしようと書いておきながら、少なくとも引分とわかっている盤面情報を活用 して、探索の省略ができないかと、あちこちに組み込んでみましたが、効果は不明。 効果がわからないというより、毎晩こつこつと評価関数のエポック数を稼いでいたところ、 どうも過学習に近い状況に陥っているみたいで、手の選択が変わってきて、むしろ、 どんどん弱くなりつつあります。むむむ。 一旦変な手を選んでしまうと、Zebraにしっぺ返しを食らって、せっかく読み貯めた プレイアウトの大半がボツになり、短いツリーで手を選択するうちに、どんどん 間違った手を打っていく模様。結果的に勝った時は、ツリーがどんどん伸びて行く のと対照的です。 で、結局、評価関数の良し悪しという話に逆戻りorz 評価関数から脱却するためにMCTS始めた頃が懐かしい・・・ http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/787
833: 535 [sage] 2017/05/25(木) 21:07:01.59 ID:nz71uY7p うあああああ、なんかおかしいと思ったらデータ読み込んでなかったw 全然変な手を打つと思ったらそういうことかーorz orz orz http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/833
847: 310 [sage] 2017/06/05(月) 19:52:31.59 ID:PVR4/NQn 強化学習にトライ中。 最初の勝敗をQ学習する方法は目に見えて学習できていそうだったのですが、 ネットワークが小さすぎたのか、比較的早い段階で飽和。ネットワークを深くして 再試行しようかと思ったのですが、せっかくなのでポリシーの学習にトライ。 しかし、Q学習と違って、学習が上手く進みません。 初期値問題かと思って、最初に教師あり学習をさせてみましたが、やはり勝率が 上がらないというか、30%近辺に落ち込んだまま浮かんでも50%くらいにしか ならない感じ。このまま続けたら、どこかで戻ってくるのか。100対局の強化学習 で30分かかるので、どうしようかと。 Q学習の方は、比較的簡単に、対象のAIに勝てるようになっていて、世代の追加が 順調に進んでいました。ポリシーだと何故ダメなのか考えれば考えるほど、頭が 混乱してます。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/847
881: 310 [sage] 2017/07/01(土) 02:18:02.59 ID:HltHgVcC >>877 自己対局だと局所解にはまっちゃう時ありますよね。 DBの内容がわからないので、以下頓珍漢かもしれませんが。 解消法としては、開始後数手については、ランダム着手にする。 途中でε-greedyみたいに、ランダムな着手を挟む。 こういった方法で、局所解から外れたところも学習対象に入れる工夫があります。 気持悪いやり方だけど、5手目だけif分で強制的に直して修正済み自己対戦データ を蓄えて学習するという方法もあります。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/881
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.040s