[過去ログ]
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 (1002レス)
【オセロ,将棋】ボードゲーム Part2【囲碁,War】 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
223: 310 [sage] 2018/02/04(日) 20:16:17.17 ID:Wmf+lsae 他人のコードは読みづらいですよね。 1年前に書いた自分のコードもですがorz Theano動作おめでとうございます。良かったです。 こちらは…GUI作るのに嫌気がさして、学習部をいじっていましたが、 そろそろ〜30手の評価関数もそれほど酷いものではなさそうな気がしてきて、 中盤探索9手読み(なんの工夫も無し)で記譜作れる事に思い至りまして。 つまり、MCTSより短時間で記譜作成できると…。 この学習で、もし中盤探索の読みがそこそこな精度になってしまったら、 そもそもMCTSにする意味ないじゃんという現実からいかに目を背け続けるか という戦いが始まりました(涙 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/223
224: 535 [] 2018/02/05(月) 18:27:38.68 ID:Q1ssK5oS やはりこの業界で生きていくには パイソンの習得は必須… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/224
225: 535 [sage] 2018/02/05(月) 20:15:05.78 ID:kkO201mJ ということでパイソンの入門本買ってきました。 とりあえず囲連星のルールを実装してみます。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/225
226: 310 [sage] 2018/02/05(月) 23:37:11.58 ID:tGe3CIWd 相変わらず、GUIから逃げています。 アルファ碁でいうところのポリシーネットの学習を放棄して、代わりに評価値から P(UCT探索に対する絞り込み項)を生成していましたが、これをQ(UCT探索の 予想スコア:これまでの探索の加重平均)から、1プレイアウト毎に再計算するよう にしてみました。 多少探索速度は落ちますが、良い感じかなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/226
227: 535 [sage] 2018/02/08(木) 20:36:12.73 ID:BwB5Lh8w パイソン入門本、一回通して読もうとしてますが、ページ数あって結構大変。 コード書きながら読んだほうがいいかなぁ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/227
228: 310 [sage] 2018/02/09(金) 23:42:10.85 ID:XzN5+u9b 新言語習得はストレスですよね。 C#ですら混乱して、C++に帰りたくなってます(汗 というか、メモリー管理できないC#にいらついて、記譜作成回りをいじって 慰みにしています。中盤探索に置換表を足して、反復深化っぽくしてみま したが、あんまり早くならなくてがっかり。 Python本はまだ買ってません。ウェブ上の入門を眺めたくらいです。 Pythonは構造やら変数の型の考えやら、落とし穴になりそうなところが 色々とありますね。計算式だけ見ていればわかったような気になりますが、 どういう順番で処理が進むのか、慣れないとわからん感じ。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/228
229: 535 [sage] 2018/02/10(土) 21:27:45.30 ID:DQEki32w パイソン、変数の型の宣言がないから他人のコード超読みずらいorz 引数に何与えていいのかとかパッとわからないorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/229
230: 535 [sage] 2018/02/12(月) 00:17:40.24 ID:eWCzbr3d 9路囲連星の最低限のルールをパイソンに移植しました。 これからテストします。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/230
231: 535 [sage] 2018/02/12(月) 02:17:04.85 ID:eWCzbr3d おおむねバグ取れたっぽい あとはこれを>>214に移植できれば… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/231
232: 535 [sage] 2018/02/12(月) 20:42:28.11 ID:eWCzbr3d 他人のコード読むの辛いおT△T これはかなり時間かかる… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/232
233: 535 [sage] 2018/02/12(月) 22:23:10.54 ID:eWCzbr3d うーん、なんかこのコード五目並べのルールにべったり依存してる感じなのかなぁもしかして。 複数のゲームに対応しているAlpha Zeroプロジェクトのコードを見たほうがゲームのルールが分離されてるのかもしれないなぁ 一応、別のプロジェクトに手を出すことも視野に入れるか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/233
234: 535 [sage] 2018/02/12(月) 23:45:59.40 ID:eWCzbr3d アルファゼロって数手前の履歴情報が必要らしいけどなんでこんなものがいるんだろう? 謎だ… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/234
235: 310 [sage] 2018/02/13(火) 13:07:22.56 ID:SwoVylIU アルファ碁の論文に書いてあったかな。次の1手的には意味なさそうだけど、 有った方が強くなるので外せなかったみたいな事が書いてあったような。 今現在の思いつきですが、ツリーサーチの末端近くでは、手の流れに応じて 点数が変わる事で、そのツリーのルート側の評価(加重平均)に影響が出てくる 可能性はある。 囲碁の場合、同一盤面が出る可能性が非常に高いのだけど、そこに至る経路で 隙があると、相手にその隙を突かれて、分岐が生じる事で、その点数は無意味に なる。けど、それは途中の分岐をしっかり読まないと判明しない。経路情報によって 評価値(評価関数直)を下げてしまえば、プレイアウトの振り分けが減って、別の もっと良い手に集中させることができる。こういう事かなぁ。 ま、本当に今思いついたばかりですが。 GUIに気が進まないまま、ぼーっと学習を見ていると、何故か(効果は微妙だけど) 速度アップの方法を思いついてしまうもので…。地味に色々改良しています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/235
236: 535 [sage] 2018/02/13(火) 22:47:18.55 ID:75Woy+K4 310さんほどのプログラマがGUIで躓くというのも謎ですね。 単に凝り性なだけですかね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/236
237: 310 [sage] 2018/02/14(水) 20:49:32.16 ID:I/pUqAGs 単にGUIが嫌いなんですorz 凝りたい気持ちと、画面遷移の罠から、心がデッドロックを起こして、 しまいに面倒くさくなってしまうという。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/237
238: 535 [sage] 2018/02/14(水) 21:17:25.33 ID:XBQY5lLn オセロで画面遷移なんてほぼいらんでしょうに。 まいいけど。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/238
239: 535 [sage] 2018/02/14(水) 22:23:18.42 ID:XBQY5lLn 五目並べのプロジェクトだとコウの扱いがよくわからないな 囲碁のプロジェクトもgithubで漁るか… http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/239
240: 535 [sage] 2018/02/17(土) 21:19:34.66 ID:9/16YNby 藤井聡太さん朝日杯将棋オープン戦優勝ですか すごいすな http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/240
241: 310 [sage] 2018/02/17(土) 21:53:57.13 ID:vz2S+0Ke ドタバタしながら音だけ聞いていたけど、なんか普通に互角から徐々に優勢を 築いて、相手の奇手にも動ぜずにさばいて、勝利って感じで、強さが際立って いましたね。 これで勝っても漫画なら編集長にバカにされるレベルと言われていましたが、 本当に笑うしかないですね。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/241
242: 535 [sage] 2018/02/19(月) 21:32:59.37 ID:k/eP19bS >>214のプロジェクトに囲連星ルールを移植してみまして、モンテカルロAIが動いたみたいです。 ただし超絶遅い。絶望しかないってくらい遅い。 10プレイアウトで10秒くらいかかります。 デフォルト1000プレイアウトになっていたのでそれぐらいないとまともな強さは出ないんでしょう。 となると1手1000秒か? 絶望しかない。 orzorzorzorzorz http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/242
243: 535 [sage] 2018/02/19(月) 21:45:50.40 ID:k/eP19bS 小路盤五目並べとかConnect4とかtic tac toe くらい小さなゲームじゃなきゃまともに動かんぞこれ http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/243
244: 535 [sage] 2018/02/19(月) 21:53:01.97 ID:k/eP19bS ,.‐''" ̄`丶、 ひどい…!ひどすぎるっ……! / \ こんな話があるかっ…! /´ \ / |\_>、_ 、r‐、 \ 命からがら… やっとの思いで… レ! ||_| |/_ ヽ\} \ 辿り着いたのに… やり遂げたのに…… |八|-/>、∪_ u`i ト、 \ / / ,くィ夕u' | |/ ``‐- 、_.、__\ 実行速度っ…! |/ / /_ヽ┐u | ,| / ,-,.=====ゝ ヾ' / r┘|.l__人 | /\// \ あの計算量がもぎ取ってしまった……! \ ) | N / //\./´ ̄`丶 |u | /|(l(l「| | | | せっかく手にした | u| / | ヾ-イ .|| l、 俺の未来…希望… _| |/| | \_|_|,. く. \ ハ.___ハ >、 \ \ \ Alpha Zero AI を……! http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/244
245: 535 [sage] 2018/02/19(月) 22:39:02.94 ID:k/eP19bS つか連想配列とか見るからに遅そうなクラス使いまくりなんだよなぁ こうなったらC++に移植する方向で考えるか?? http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/245
246: 535 [sage] 2018/02/19(月) 22:59:04.05 ID:k/eP19bS 囲連星ルール部分をC++で書きなおしてパイソンと結合させるという手もあるんだろか?? とにかく今のままじゃ遅すぎる 囲連星ルール部分がどれくらいネックになってるかもよくわからないですが多分相当遅い http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/246
247: 535 [sage] 2018/02/19(月) 23:28:23.57 ID:k/eP19bS 五目並べルールだとそこそこのスピード出ますね 当たり前か… やっぱ囲連星ルール実装がネックか〜 は〜 死にたい http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/247
248: 310 [sage] 2018/02/19(月) 23:48:36.73 ID:KY7Wcd5F PythonからC++関数を呼べるみたいですね。 C++からPythonも呼べるみたいです。 前にPythonに手を出そうかと思った時にググったら出てきました。 前者の方が解説が多かったと思います。 自分はBitboardを使いまくりなので、Pythonに手を出しあぐねていました。 また、評価関数の学習部と、評価値計算をうまく分離できれば、前者を Python、後者をC++で書けないかなぁと思っていますが、im2col関数の うまい実装を考えるのが面倒で、放置になっています。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/248
249: 310 [sage] 2018/02/19(月) 23:56:04.01 ID:KY7Wcd5F ここ数日強化学習の結果がよさげになってきたので、結果の良かった学習方法に 集中させたら、また変な学習になってしまったようで、迷走中です。 学習の具合が良いと、色々な探索も速度アップするんだけど、具合が悪いと全部 悪循環になってしまうという。 仕方無いので、中盤探索の反復深化を作り、その結果を置換表に溜めてオーダ リングを行うようにしてみましたが、効果があったのかよくわからない罠。 こちらも、学習の具合が良くなったら、急激に効果が表れるのではないかと期待 しているんだけど。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/249
250: 535 [sage] 2018/02/21(水) 01:00:17.47 ID:65PdIEqg SWIGっての調べてます。 なかなか手ごわい http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/250
251: 535 [sage] 2018/02/21(水) 22:17:30.79 ID:65PdIEqg まずは簡単なC++関数一個だけのパイソンモジュール作成に成功しました。 つぎは囲連星ルールパイソンモジュールの作成ですね〜 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/251
252: 535 [sage] 2018/02/21(水) 23:35:14.72 ID:65PdIEqg なんかdeepcopyとかいうのに対応しなきゃいかんようなのだが。 http://mevius.5ch.net/test/read.cgi/gamedev/1508056498/252
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 750 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.017s