[過去ログ] 【トリップ検索】MERIKEN's Tripcode Finder その5 (995レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
773(1): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)09:38 ID:0eajDBSB0(1/7) AAS
>>768
AVX,AVX2だってメインストリームPC向けのほうがXeonDPより
1年先行してたし、XeonとCore*は共通設計なので、
意図的に無効にしない限りは使えるものかと。
SHA-1アクセラレーションサポートに至ってはARMv8でも
標準機能として組み込まれてますし。
>>769
319433-015.pdfの
> Figure 2-1. Procedural Flow of Application Detection of AVX-512
> Foundation Instructions
省5
774(1): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)09:52 ID:0eajDBSB0(2/7) AAS
YASMはでかすぎてソース読んでないけどXbyak程度ならちょっと改造すれば
512対応できますよ。というかXeon Phiの命令セット仕様書読んで
なんとなく書きなぐったコードが手元にあったり。
C++で{}は演算子として使えないので()か[]で代用することになりますが・・・
775(1): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)10:53 ID:0eajDBSB0(3/7) AAS
ああそうだ。これを言わないと。
>>28
1〜5ラウンド目は初期値が定数なのでほんの少しショートカットできますよ。
というか、キーの変更方法をちょっと弄るだけでぶっちゃけ
10ラウンド目くらいまではショートカットできてしまいます。
DESクラックも実効10ラウンドまで削れるという論文が出てたけど
あれはStandard DESの場合で、16ラウンド×25の400ラウンドなので
せいぜい394ラウンドのショートカットになる程度です。
(salt処理を考慮すすと実際にはここまでは削れません)
776: ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)11:57 ID:0eajDBSB0(4/7) AAS
あと今更だけどVecTripperのこれが気になりました。
> いまさらAVXに対応してみた (12桁のみ)
> 3オペランド化で余計なmovdqaを消して、VEXエンコーディングで命令長が
> 削れるものを削った程度なのですが、何故かSSE版と比べて25%ぐらい
> 高速です。16bytes/clkのフェッチ帯域がクリティカルだったのだろうか。
SSEのコードだとぱっと見2000命令軽く超えてるのでそれだけで
μOPs cache流しちゃってますね(AVX*でギリギリ?)
SHAコアのコードを分割して何十個か単位でまとめてループ処理させると
μOPs cacheの利用効率あがるんじゃないかと思ったり。
ああ、おいらはこっちには復帰しませんけどね
778(2): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)12:43 ID:0eajDBSB0(5/7) AAS
こんにちは。
SHA-1拡張は複数
16並列
> f1, f2, f3やROTLを処理してくれるのかな? AVX-512より速いわけ無いと
> 思ってましたけど、興味が出てきました。
SHA-1はAVX-512の命令セットマニュアルのChapter8に載ってますが
専用回路が載るっぽいですね。
SHA1RNDS*とSHA1NEXTEの組み合わせで各ラウンドを処理できるようになってます
理屈上160命令+α程度でSHA-1の80ラウンドを処理出来てしまいます。
省4
779: ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)12:44 ID:0eajDBSB0(6/7) AAS
上にノイズが載りましたが気にしないでください
781(1): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)14:39 ID:0eajDBSB0(7/7) AAS
俺の嫁ktkr
>SHA-1専用回路なんだからきちんと全部計算するんだよな。
いや、AESと同様に、各ラウンドを2命令でこなせる命令を追加するだけよ。
VIAのPadLockみたいなレジスタにセットして1命令発行したらハイ完了
みたいなインターフェースではない。
どのみちAESほどには並列化できるところがないからそれほど速くなんない
と思われ。
差分解読法はSSEだろうがAVXだろうがOpenCLだろうが使えるテクだけど。
前半を事前計算してキー変更の差分だけ計算するにしても、70ラウンド程度はかかるでしょ。
数学的にエレガントなショートカット方法があるなら俺も知りたい。
省4
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.033s