[過去ログ] 【オセロ,将棋】ボードゲーム【囲碁,War】 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
541: 460 2016/09/10(土)21:06 ID:FA2ccDEd(1) AAS
>>534の読みを深くさせた自己対局棋譜ですが、15万程度集まったので
無理やり学習してWZebraと対局させてみたところ、黒持ちで+12、白持ちで+2でした!
次善手や序盤ランダムの考慮と読みを深くした効果が現れてて安心しました。。100万達成した時の結果が楽しみです。
542(1): 460 2016/09/11(日)09:03 ID:UepiTkRD(1/2) AAS
ついにBOOKの読み込みとアルファベータによる手の選択を実装できました。
まだ最善しか着手できないので、誤差率によるランダム着手も実装しようと思います。
ゼブラのExtra-Bookをそのまま使っているので、ゆくゆくは自力で構築できるシステムを
考えたいところ。。
543(1): 2016/09/11(日)11:41 ID:dMHrH3w2(1) AAS
>>542
やっぱり最終目標は完全解析なんですか?
544: 460 2016/09/11(日)15:25 ID:UepiTkRD(2/2) AAS
>>543
いえ、さすがにそこまでは・・・w
Edaxの作者が完全解析を先行してやってるみたいですし、そこは任せようかなと。
最終的にEdaxやMasterReversiと同等の評価関数やBOOKを作成できるレベルまで持っていきたいです。
545(1): 535 2016/09/12(月)21:36 ID:vkOlNla9(1/2) AAS
>>535です。
<number of gammas for this feature>というのがよくわからん。
とりあえず1にしとけばOKみたいな?
input.dat色々いじってみたけど確かにそれっぽい値はに出る。
546(1): 310 2016/09/12(月)22:52 ID:5hD0Gf9W(1) AAS
>>460さん、着実に進んでいてうらやましい。
自分はというと、だんだんとオセロの事は忘れて、ディープラーニングのプログラムの
確認修正、機能追加に頭がスイッチしちゃってる感じです。むむむ。
C++スキルも微妙に上がってきていますので、オセロ側に戻る時も、もう1回1から
全部コーディングしなおした方が良いかもw。ほとんどCの状態から始まって、もう3回
くらい書き直しているので、そんなに時間かからないと思うし。
と、どんどん脱線していくのであった。
>>545さん
そのプログラム見てないですが、γというと、たいてい何かの係数パラメータじゃないかと。
547: 535 2016/09/12(月)22:58 ID:vkOlNla9(2/2) AAS
>>546
返信ありがとうございます。
係数ですか。詳しい説明がどこにあるのかわからなくて。。。
プログラムって最初から書き直すほど洗練されていきますよねw
548: 535 2016/09/14(水)22:57 ID:lQtAf6dT(1) AAS
本番のデータ使うと結果が表示されないorz
入力ファイルの形式なんか間違ってるんだろうけど
何間違ってるのかわからんorz
549: 535 2016/09/15(木)21:47 ID:NUOEmvbB(1/2) AAS
もしかして万が一だけど同じフィーチャーに属するガンマは同じチームになれないとかあるのか?
550: 535 2016/09/15(木)23:35 ID:NUOEmvbB(2/2) AAS
うお〜わかんねぇぇぇ
コード熟読しかないのか?
厳しいぃぃぃ
551(1): 310 2016/09/16(金)00:03 ID:44uFy3HE(1) AAS
featureってコンピュータの世界では、機能を意味するよね。
あと、もう一度読み返すと、γが複数形になってるので、
γの数であってγの値ではなさそう。
「この機能で使用するγの数」となるけど・・・
これだけだと正直なんのこっちゃだねw
この機能が何を表すかどこかに書いてないの?
552: 2016/09/16(金)07:31 ID:mrye4Vvn(1) AAS
もう一年くらい将棋をちまちま作ってるけど、なかなか強くならないな
最近ようやくアマ高段くらいには行った感じだ
ランダムでただ指すところから始めて、先人の歴史を全部なぞるようにプログラムして来た
みんなはゲームは違うだろうけど、もうその筋ではかなり強いレベルなの?
553: 460 2016/09/16(金)13:50 ID:gJ0b6G2+(1) AAS
自己対局での棋譜生成ですが、10手読みだとまだまだ精度が落ちるようで、思いきって中盤16手読みの24手読みにしてみたところ…10分で35局…w
今日は出勤時間がせまっていたのもありこのままで生成していますが、
中盤14手読みか12手読み、22マス空き完全読みにした方が良さそうです。
ああ、PC10台くらい並べて棋譜生成したい…
554: 535 2016/09/16(金)21:02 ID:l6ih+FVI(1/3) AAS
>>551
返信ありがとうございます。
どこかに解説あるんですかね?
ちょっと本気で探してみるか…
555: 2016/09/16(金)21:22 ID:l6ih+FVI(2/3) AAS
外部リンク:www.remi-coulom.fr
の「囲碁の手のパターンのEloレーティングを計算する」をよみゃいいのかな?
もしかして
556: 535 2016/09/16(金)22:26 ID:l6ih+FVI(3/3) AAS
囲碁の手の特徴にパス、トリ、伸び、自己当たり、当たり、
盤端との距離、直前の手との距離、2手前の手との距離、モンテカルロオーナー
などがあると書かれている。
feature=特徴?
557: 2016/09/17(土)22:31 ID:mQ7ypIPZ(1) AAS
下がりすぎ
上げるぜ
558(1): 460 2016/09/18(日)02:39 ID:6855FAgd(1) AAS
オセロオンラインというアプリに付属されている真・HAYABUSAと対戦してみました。
どうも定石がかなり充実しているようで、普通にやってると
こちら側が記憶していないドロー進行に分岐されて負けます。。
しょうがないので野兎とか序盤から不利な定石に分岐して評価関数の勝負に入らせると、案外勝てましたw
評価チューニングがEdaxなどに比べると結構甘いようです。
とはいえ国産アプリでここまでチューニングされているとは思わなかったので驚いています。
559: 2016/09/18(日)09:21 ID:u+E0nELs(1) AAS
おめでとうございます
ひょっとして物足りないと感じましたか?
それなら次は
PREMIUM・HAYABUSA に挑戦してみませんか?
いまなら特別キャンペーン中につき(ry
560: 535 2016/09/21(水)00:02 ID:DjDR9tnr(1/2) AAS
すいませんが誰か俺のデータを>>535のmm.exeにかけてみてくれませんか?
まじで何が悪いのかさっぱりわからん。
環境の問題かも?
外部リンク:thuploader.orz.hm
のmy_input.zipが俺のデータです。
だれか親切な方よろしくお願いします。
561(1): 310 2016/09/21(水)01:01 ID:CFP8O8Vn(1) AAS
>>558
外部リンク:www.slideshare.net
これですね。色々AIの特徴を説明してますが、まあLogistelloの
日本語解説みたいな感じで、皆さんのAIもほぼ同じ構造かなと
思います。
テレビ番組企画でEdaxと良い勝負するAIを短期間で開発したという
のが開発経緯らしいので、恐らくEdaxをたたき台にして定石DBの
学習をしていると思います。
つまり、Edaxよりちょこっとだけ強ければよいと割り切った目標をたて、
目標がはっきりしている分、手間をかける箇所を、定石DBの対局学習に
集中したって感じだと思います。想像ですが。
で、これ読んだ時に、オセロAIの強さって結局は定石DBじゃんと、
結構真剣に思いまして・・・。まあ、それゆえ、オセロAIの開発者の多くが
ドロー進行のリストアップに走ってしまったのかなぁと。
562: 535 2016/09/21(水)20:18 ID:DjDR9tnr(2/2) AAS
環境が悪いのかと思い押し入れからノートPCを引っ張り出して走らせてみたところ
計算結果がNaNになってるっぽい。
駄目なのか?うーむ。
563: 460 2016/09/22(木)13:08 ID:aLXK2a2e(1) AAS
>>561
ほとんど考えずに打ってくるので、もしやと思い定石からわざと外してみたらいきなり10秒超の長考でした・・・w
本当にBOOKの精度がEdaxよりちょっと良いのでしょうね(逆に言うとそれだけ)
開発期間が短期間って制限があったらしいので、しょうがないのでしょうけどもったいない気もします。
564: 310 2016/09/22(木)20:43 ID:esximYO0(1) AAS
BOOK学習ってあんまり実装例見ないので、その点は評価しても良いかなと。
Buroさんの論文はあるので、自分もいずれは実装しようと思っています。
が、BOOK学習で、別のオセロプログラムとひたすら対局学習させると、そのプログラム
相手限定ならほぼ負けないBOOKが得られるんです。
EdaxのBookは引き分け進行のリストアップで、そこに記載されていない分岐は、基本は
分岐した方が負けるはずなのですが、分岐後は純粋に評価関数の読みの勝負になるの
で、いかなEdaxでも間違える事があります。で、勝った手順、負けた手順をリストアップし
ていき、負けたら勝つ手順が見つかるまで、ランダムな手番で別の分岐を探していく。
Edax側がBOOK学習をオフにすれば、間違えた箇所は何度対局しても同じ間違いをする
ので、勝った手順になれば勝ちは確定し、負け手順は自分は打たないようになっていく。
要するに、そのプログラムの弱点を学習する事になるので、勝率が上がっていく。
EdaxのBookより精度が良いというのとはちょっと違う気がします。
とはいえ、Edaxとかの引分進行リストをパクっても意味が無いし、限られた時間で、パソコン
ぶん回して引分進行を発見していっても、間に合わないしで、これしかやりようがないんだ
とは思います。
実はこれに気が付いた時、BOOK学習+乱数着手(打たない箇所がない)で、自己対局を
延々と続けていくと、究極のBOOKができるんじゃないかと妄想してしまいましたが、よくよく
考えたら、それって全手順リストアップというか、完全解析大差ない事に気が付きました(汗
565: 535 2016/09/22(木)21:29 ID:kzrJOomn(1) AAS
RemiさんのMM法諦めるしかないのかなぁ
他の学習方法探すか…
566: 535 2016/09/27(火)23:07 ID:AU3JIk+S(1) AAS
いまいち手ごろな強化学習が見つからなかったので
モンテカルロ木探索をパターンに応用することにした。
567: 535 2016/09/28(水)22:21 ID:DgDU0GF3(1) AAS
とりあえずConnect 4のAI書いてるんだけどまあまあ強くなってきた。
Connect 4は完全ソルバが公開されてるので
先手でこれに一発入れるのが当面の目標。
Connect 4 完全ソルバ
外部リンク:connect4.gamesolver.org
568: 535 2016/09/29(木)20:34 ID:1GHOMTNV(1/2) AAS
評価関数の基になるパターンが悪いせいで
一生学習しても完全ソルバに勝てない気がしてきました。
569(2): 535 2016/09/29(木)21:12 ID:1GHOMTNV(2/2) AAS
まあ、Connect 4は習作なので一定の成果が確認できたということで一旦休止します。
これから本番のゲームに着手します。
できたConnect 4のexeをアップしてみます。
外部リンク:fast-uploader.com
Connect 4の経験がない人にはかなり強く感じるはずです。
遊んでみてください。
570(1): 535 2016/09/30(金)22:44 ID:Ol1OvzoR(1) AAS
人為的なパターンを評価関数の基礎においてると
幾ら学習しても完全解析にたどり着かない可能性があるよね?
十分学習すれば完全解析にたどり着くと保証できる
出来るだけ効率の良いパターンセットてのは
なんとか数学的に割り出せないだろうか。
上下前次1-新書関写板覧索設栞歴
あと 432 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.019s