[過去ログ]
【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
797: 310 [sage] 2017/04/18(火) 01:24:07.08 ID:Ohai0OaC 評価関数のエポックを更に進めたら180エポック近辺から勝てなくなってきました。 もしかしてたまたま間違ったところが、zebraの弱点をついていたのかも知れないし、 評価関数の値にメリハリがついてきて、逆に見落としが起きやすくなったのかも 知れないし。過学習かも知れないし。 評価関数をブラッシュアップするには、負け手順を棋譜化して、学習データに投入 しなきゃならん。 ところが、負け確定後に例の自爆モードが作動してしまいます。棋譜として使えるよう にするために、ソルバーを復活させました。ついでに色々やってたら、見なかった事 にしていたバグもとれました。ついでだからと偶数理論を実装したのですが、かえって 遅くなってしまった。他の人はどういう実装しているのだろう。 今の速度だと35手目から読み切らないといけない。今の速度だと時間の予測が難し いというか、軽く1時間はかかりそう。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/797
798: 535 [sage] 2017/04/19(水) 21:59:17.68 ID:WjbK3YLE Ponanzaがディープラーニング取り込みに成功したとかなんとか。 ハードもものすごいものを用意するそうですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/798
799: 535 [sage] 2017/04/21(金) 20:55:54.67 ID:ZLYvyeQY 大分勝率上がってきた。 思考時間長いから数こなせないのが厳しいですね。 25局目 黒(airandom.dll)の勝利回数: 8 白(ai-lv3.dll)の勝利回数: 17 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/799
800: 535 [sage] 2017/04/21(金) 22:05:48.97 ID:ZLYvyeQY やっぱディープラーニング憧れるなぁ。 俺のAIにもブレークスルーを起こしてくれw http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/800
801: 310 [sage] 2017/04/23(日) 20:02:43.30 ID:Kquj3Rxt 色々係数調整したらめっちゃ弱くなって焦ってあちこちいじってました。 最初の調整の方向が逆だった模様で、反対に振ったら少し良くなりました。 過学習っぽい問題を何とかしたくて、ポリシーネットが作れないか、もう一度挑戦してます。 線形Softmaxでまた色々やっていたのですが、今まで上手く行かなかった理由が判明。 特徴を圧縮するのに…反転させたり回転させたりしていたので、盤面位置がわからなく なった投入データに対して、盤面との対応ができてる教師データと整合性が取れなく なっていたと…いまさら気づきまして…学習部分を全面的に作り直しとなっています。 なんて馬鹿な事をしていたんでしょう(涙 つまり、これが原因だったら、MLPも使えるかもって事です。 流石にDCNNは関係ないですが。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/801
802: 535 [sage] 2017/04/24(月) 23:38:10.10 ID:Jt3D6fnV もう一回connect4に立ち返ってみるかな… 気分を変える意味でも… http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/802
803: 535 [sage] 2017/04/25(火) 21:31:44.16 ID:I7r6uvd5 あ〜なんか新しいことすんの億劫だな。 プログラミングは少し充電期間をおいて本でも読もうかな。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/803
804: 名前は開発中のものです。 [sage] 2017/04/27(木) 01:15:37.14 ID:KUFXWb0v 中学生が羽生さんに勝っちゃったとかでえらい盛り上がってるね http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/804
805: 310 [sage] 2017/04/27(木) 22:32:29.06 ID:gagL5fDM 億劫な時ありますね。アイデアが枯渇した時とか、陥りがちです。 しばらく放置するとアイデアが出て来たりします。 さて、線形Softmaxなポリシーネットですが、色々やって何とか計算開始しました。 回転同形の処理を真面目にやったらメモリーパンクでスワップしてしまってボツ。 仕方がないので、エポック事に回転同形をランダムに作る事に。 計算にものすごい時間がかかるので、ミニバッチサイズをミニとはとても言えない ほどでかくして時短。お蔭で6時間越え→50分程度になりました。もっとでかくすると 更に時短できるかな。 序盤の盤面は重複が多く、学習に悪影響がありそうなので、%指定してカット。 (そのうち、同一盤面同一次着手は1件に集約しようかと思っています。) こんな感じで現在2エポック目ですが、57%くらいの一致率という極めて優秀な成果が 出てきています。 それでも着手不能箇所が確率1位になっちゃったりするので、使用時に着手可能位置 のみ計算するようにしました。これで多少は一致率が上がるはず。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/805
806: 310 [sage] 2017/04/27(木) 22:33:06.57 ID:gagL5fDM 藤井4段凄いですね。 コンピュータ将棋で鍛えたからかな。 なんか新しい手を打ってるみたいですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/806
807: 名前は開発中のものです。 [sage] 2017/04/28(金) 07:46:25.71 ID:cnKbVTYz ニュースを見て藤井猛が勝利したのかと 勘違いした俺… ニュースにならねえよ! http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/807
808: 535 [sage] 2017/04/29(土) 00:08:17.53 ID:knMl9lYg ニューラルネットワーク自作入門という本を買ってきました。 平易に書こうとしてるのが伝わってくる本ですね。 平易に書くの最近の流行りなんですかね? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/808
809: 310 [sage] 2017/05/03(水) 15:03:32.93 ID:v36x8qrF 最近はもっぱらポリシーとバリューの両評価関数のテストです。 ポリシーの方は線形ソフトマックスで大丈夫そう。大体50%の正答率になります。 MLP版もコーディングはしてますが、まだテストまで至っていません。 バリューの方は、ステージ分割なしのMLP版を試してます。 計算に時間がかかりすぎて調整が進みません(汗 頭の片隅には、いつかはDCNNというのが残っています。 以前やった時に、畳み込みフィルタ演算の展開形を考えた事あります。 その時は、汎用性が無いという理由で、あまり乗り気じゃなかったのですが、 今となっては、そのまま進めればよかったかなと思う次第。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/809
810: 名前は開発中のものです。 [sage] 2017/05/04(木) 17:16:11.41 ID:Hvuj7SvG pona負けたとかなんとか http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/810
811: 310 [sage] 2017/05/05(金) 01:52:31.91 ID:Orwfb9MI 世界コンピュータ将棋選手権ですね。 8勝1敗同率で、elmoに直接対決で負けた関係で予選2位通過みたいですね。 将棋は電王戦くらいしか見てなかったので、マシン制限があると思ったら、 こっちは凄いですね。CPU1092(Xeon)にGPU128基ですか…。 やっぱディープラーニングすると、それなりのマシンパワーがいるのよね。 しかも最速マシンは20億NPSとか言っているみたい(笑うしかない)。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/811
812: 310 [sage] 2017/05/05(金) 02:46:05.76 ID:Orwfb9MI で、Ponanza Chainerに対する半可通っぽい疑問。 アピール文章読んだけど、ディープラーニングは評価関数ではなく、 ポリシーネットに相当する次の1手導出に使われているっぽい。 何故バリューじゃなくてポリシーなのか? で、αβ系探索でポリシーとなるとオーダリングに使うくらいしか思いつかない。 将棋ってオーダリングに良いヒューリスティックスないのかな? YBWCのPV決定だと縦に並んじゃうから、並列にする意味がない。 確率の高い手は次の段でPVの数を増やしたりするのかな? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/812
813: 名前は開発中のものです。 [sage] 2017/05/05(金) 08:17:59.66 ID:cViTmSg9 将棋(やチェス)だとYBWCよりもLazy SMPが流行ってるみたいですね Ponanza Chainerはそれのクラスタ版のeXtreme Lazy Smpらしいですが。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/813
814: 310 [sage] 2017/05/05(金) 08:31:32.47 ID:Orwfb9MI >>813 どうもです。早速見てみました。 自分のPCは2コアの擬似4コアなので恩恵なさそうです(汗 つか、並列化についてはPPLにお任せしちゃってるので、あまり要点が わかっていないかも。 しかし、GPS将棋のクラスタすげーと思っていた時代は、一瞬で過去の ものになってしまったのですねぇ。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/814
815: 310 [sage] 2017/05/05(金) 17:24:07.29 ID:Orwfb9MI elmo優勝でPonanzaが2位みたいですね。 なんか、将棋も強くなるスピードが尋常じゃない感じ。 目標設定して(前年比9割勝利とか)、マシンパワーとか確実性が ある所にも、資源を振り向けて達成しているみたいにも見えますが。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/815
816: 名前は開発中のものです。 [] 2017/05/05(金) 17:48:22.87 ID:hWowcZg5 ディープラーニングと将棋の相性が悪いてことだろうか? elmoとやらは既存アルゴリズムなんですよね? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/816
817: 名前は開発中のものです。 [sage] 2017/05/05(金) 18:47:05.96 ID:hWowcZg5 elmoて公開されてるんです? すごいなー ソース読んでみようかなー http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/817
818: 310 [sage] 2017/05/05(金) 20:43:38.31 ID:Orwfb9MI >>816 自己対局で作った自作定石のDB積んでるみたいです。 ディープラーニングの使う場所は、オーダリングくらいしかなさそうなので、 実はオーバーヘッドとの兼ね合いが微妙じゃないかと疑ってます。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/818
819: 名前は開発中のものです。 [sage] 2017/05/06(土) 09:18:07.29 ID:ODpfq25G 自分もディープラーニングっぽいので将棋作ろうとしたけど 能力も価値も違う駒が複数あるから、それをどうするかで悩んで止まった そのまま探索に掛けるわけにもいかず ようするに駒割をどうするかわからなかった 一致率自体は普通に上げられるんだけどね http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/819
820: 名前は開発中のものです。 [sage] 2017/05/06(土) 09:20:21.30 ID:bJnH/Q0z そもそも将棋って、同種のゲームの中でAIにやらせるのは一番難しいくらいなんでしょ? もっと簡単なゲームからやってみては。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/820
821: 310 [sage] 2017/05/06(土) 09:41:02.64 ID:eGOwqfr/ >>816 相性が悪いというより、効果を出し切れるところまで行かなかったのかも知れませんね。 Ponanzaは2位とはいえ、他の人には全部勝っているわけで、弱くなったわけではないと 思います。 elmoは予選で1敗しているので、予選時にponanzaに勝ったのまぐれかもと思っていたけど 直接対決2連勝で、決勝は全勝なので、やはりelmoの1年間での進歩が凄いかと。 1年間という時間制約の中で、レート向上の目標を200くらいとして、それを何で達成 するかと考えた時に、ディープラーニングを使わなくても同じくらいの向上はできたのかも 知れませんね。 とはいえ、今年は十分に活用しきれなかったけど、適用の仕方を煮詰める事で、来年から はボーナスのレート向上が見込めるとか、そういう事はあるかも知れませんね。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/821
822: 535 [sage] 2017/05/08(月) 22:06:30.07 ID:bLY5QORw ディープラーニングやり直してみました。 与えられた局面の勝率を学習させて、一手読みで打たせてみました。 局面が均衡しているときは結構いい手を返すみたいですが、 不利に傾くと全然おかしい手を打ち始めます。 学習させた棋譜に偏りがあるんだろうか? どちらかに不利に傾いた局面も学習させるべき? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/822
823: 310 [sage] 2017/05/08(月) 23:27:34.27 ID:Byk3wJkT 悩ましいところですね。偏った棋譜を学習させるべきか、否か。 相手も弱いから、偏った棋譜になるわけで、そういう時にも問題が起きないように 探索と組み合わせるわけで。そう考えたら、そのままで良いのかも知れないし、 やってみないとわからないかも。自分的には、MCTSにおいてモンテカルロの 問題(隘路の騙し構造)に対して、先に避けるために、選択肢を偏らせるモノだと 認識していますので、拮抗している時に正しい手を返せばよいかと思っています。 自分は、Buroさんの特徴量をベースにしたMLPで評価関数作っているのだけど、 傾向としては線形回帰と変わらない印象です。与えている元データの偏りなのか、 それとも特徴量の選択の問題なのか、悩み中です。DCNNで特徴量抽出まで やらせたいと、をもう一度試そうかなと言う機運になってます。 ただ、頭の中に、ワンチップマイコンで学習外だしというのがチラついていまして、 そこに入り込むと数か月、下手したら半年はとられるなぁと悶々中。 そうそう。アルファ碁のバリューネットの勝率ですが、割引率を考えたら… という点に思い至りまして。普通勝率の評価関数はロクなもんじゃないのですが、 強化学習とセットなら、ありかもとちょっと思っています。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/823
824: 310 [sage] 2017/05/15(月) 09:41:45.01 ID:hagdu+z8 オライリーさんのところのディープラーニング本(Pythonで学ぶ奴)を読んでみました。 自分で実装する人には、なかなか良いです。Python知らないですが、説明だけで結構 おなか一杯になります。 オライリー本で、畳み込み演算の実装(行列に落とし込む)の良い方法がわかりました。 自分が以前やって放置した展開形よりもっと良い方法があるんですね。ちと畳み込む気 が湧いてきました。 現在MLP版のポリシーネットを学習させていますが、テストデータに対して60%越え まで来ました。一方で入力データサイズが89万(特徴)×16万(ミニwバッチ)とか わけわからん事になっていて、もう畳み込んでも処理量大差ないんじゃないかと思って いたところですので、学習限界が見えたら、畳み込みに行ってみようかと思います。 あと、やっぱり強化学習ですね。既存データで学習していても埒があかない気が強くして きました。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/824
825: 535 [sage] 2017/05/15(月) 22:23:31.10 ID:1z5ugcc4 ディープラーニング黒石を1、空点を0、白石を-1を入力として学習させたけど、 黒石かそうでないかの01データと空点かそうでないかの01データと白石かそうでないかの01のデータ と3つに分けて食わせたほうがいいんだろうか? http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/825
826: 310 [sage] 2017/05/16(火) 09:54:31.52 ID:Vk+2t4O7 >>825 問答無用で後者です。 http://mevius.5ch.net/test/read.cgi/gamedev/1057763418/826
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 176 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.032s