[過去ログ] 【トリップ検索】MERIKEN's Tripcode Finder その5 (995レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
135: ◆Meriken//XXX 2013/09/24(火)14:22 ID:SuYpLKhoP(7/10) AAS
>>131
MTFの「分散処理」タグで編集できますよ。次からはゆぐちゃんスレでお願いします。

【分散トリップ検索】Meriken's Tripcode Yggdrasil
(p)2chスレ:esite
136: ◆Meriken//XXX 2013/09/24(火)14:24 ID:SuYpLKhoP(8/10) AAS
>>134
ありがとうございます。ようやくこれで安心して寝られますw
137
(1): ◆Urotsuki/1Ca 2013/09/24(火)15:36 ID:hElffOfN0(1) AAS
電気料金の関係で当分稼働できそうにない…
すみません…
138
(1): やんやん ◆yanyan/Pails 2013/09/24(火)16:26 ID:yDbtGzZA0(2/2) AAS
On some (but not all) micro-architectures, there are timing differences due to "domain crossing penalties".
For this reason, one should generally use movdqa when the data is being used with integer SSE instructions,
and movaps when the data is being used with floating-point
instructions. For more information on this subject,
consult the Intel Optimization Manual,
or Agner Fog's excellent microarchitecture guide.
Note that these delays are most often associated with register-register moves instead of loads or stores.

だそうな、integerだったらmovqdnなんだと。マニアックすぐるw
139
(1): ◆Meriken//XXX 2013/09/24(火)16:37 ID:SuYpLKhoP(9/10) AAS
>>138
ところがNehalem以外だとintegerでもmovapsのほうが
movdqaよりも速いんですよねえ…
VC++ 2010はマニュアル通りにmovdqaを使ってましたけど、
それだとうまくいかないようです。
140: ◆Meriken//XXX 2013/09/24(火)16:39 ID:SuYpLKhoP(10/10) AAS
>>137
電気料金は大きな壁ですよねえ…
今までお疲れ様でした。またいつでもお越しください。
141
(1): 2013/09/24(火)19:22 ID:HJd6RTmw0(1) AAS
>>139
何となくですが、
外部リンク:2chnull.info
これの347辺りからの話が、ヒントになりそうな?
これ以上は、各アーキ毎の最適化マニュアルの比較と、
マイクロアーキテクチャ自体の変更情報を全部追わないと、どこがネックになってるのかは
分からない気がするw

ちなみに>>107の環境で>>126を回した結果
【10分間のCPU検索の平均速度】 146.58M tripcode/s

あれ・・・あまり変わってない・・・なんでだろ。
142: ◆Meriken//XXX 2013/09/25(水)15:05 ID:Q0OWgfvvP(1/9) AAS
>>141
> これ以上は、各アーキ毎の最適化マニュアルの比較と、
> マイクロアーキテクチャ自体の変更情報を全部追わないと、
> どこがネックになってるのかは分からない気がするw

リンク先の話は非常に興味深いですねえ。なかなか奥が深いです。

> あれ・・・あまり変わってない・・・なんでだろ。

同じNehalem系でもGulftown(Westmere-EP)は違うのかな?
難しすぎですねw
143
(1): ◆Meriken//XXX 2013/09/25(水)16:18 ID:Q0OWgfvvP(2/9) AAS
新しい開発版をうpしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 7
外部リンク:www.meriken2ch.com

Alpha 6からの主な変更点は以下の通りです。

・Nehalem系のCPUでの12桁トリップのCPU検索の高速化。
・10桁トリップのCPU検索の高速化。

>>126の成果を取り込んだついでに、10桁トリップ検索でもmovapsを使うように
しました。AVXに対応していない、Nehalem系以外のCPUでは、10桁トリップの
CPU検索は少し速くなっているはずです。
前のバージョンとの速度の比較を報告していただけると助かりますです。
144
(1): ◆YSRKEN.ceVZZ 2013/09/25(水)16:21 ID:HNdGVGJA0(1) AAS
>>143は私(x64+SSE2/AVX、Ivy Bridge)でも10桁が高速化するのでしょうか?
145: ◆Meriken//XXX 2013/09/25(水)16:23 ID:Q0OWgfvvP(3/9) AAS
この週末に彼女が日本から遊びに来るので、開発はしばらくお休みです。
次の更新はHaswell購入後のAVX2対応になる予定です。
146: ◆Meriken//XXX 2013/09/25(水)16:26 ID:Q0OWgfvvP(4/9) AAS
>>144
Ivy BridgeはAVXに対応しているので今回は速くなりません。
AVX版はまた今度書きなおす予定です。
147: ◆e7m8FSZy3U 2013/09/25(水)19:34 ID:CggXwBge0(1/2) AAS
/.Jから飛んできました。
ちょっと面白そうなのでしばらく回してるかもです・・・
148: ◆e7m8FSZy3U 2013/09/25(水)19:58 ID:CggXwBge0(2/2) AAS
あぁこれって何か。分散のみに参加するって出来ないのね
それはつまらんなぁ。
149: ◆Meriken//XXX 2013/09/25(水)20:04 ID:Q0OWgfvvP(5/9) AAS
9文字ぐらいの適当な長いパターンをローカルで1つだけ指定してやれば、
分散のみに参加しているのと変わりないですよ。
150: ◆Meriken//XXX 2013/09/25(水)20:42 ID:Q0OWgfvvP(6/9) AAS
Linux版を作っていた◆znjnB.IJwZLUさん、最近見かけないなあ。
忙しいのかしらん。AVXに最適化されたS-Boxをぜひ見せてもらいたかったんだけど、
自分でやったほうが早いのかな。

まあやることといったら全部レジスタで回すようにして、なるべく2バイトのVEX Prefixを
使うようにするだけだからなあ。でも言うのは簡単だけど、実際にやるのは大変そうだorz
151
(2): ◆Meriken//XXX 2013/09/25(水)20:56 ID:Q0OWgfvvP(7/9) AAS
定格のi7-3770Kだと10桁トリップのCPU検索の速度はこんなんです。

mty_win_x64_20071012: 21.72M TPS
MTF (AVX): 25.56M TPS

大分速くなったけど、もうちょっといけそうなんだよなあ…
152: ◆Meriken//XXX 2013/09/25(水)20:59 ID:Q0OWgfvvP(8/9) AAS
6番目のS-Boxにvmovdqaが6個も残ってるぞ…
まずこいつらからやっつけないと。
153: ◆Meriken//XXX 2013/09/25(水)22:23 ID:Q0OWgfvvP(9/9) AAS
vmovdqaを2つに減らすことが出来ましたが、一時変数が1つ増えて
速度は横這いです。難しすぎる…
154
(3): ◆LoveNico9g 2013/09/26(木)02:43 ID:sJOvmiPd0(1) AAS
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 -> 1.1 Free Edition Alpha 7
【OS】Windows 7 Professional SP1
【ディスプレイドライバ】320.57

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
省9
1-
あと 841 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.278s*