[過去ログ]
Qiita 2 - キータぞ、来たぞ、キータだぞー (1002レス)
Qiita 2 - キータぞ、来たぞ、キータだぞー http://mevius.5ch.net/test/read.cgi/tech/1658762410/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
816: 812 [sage] 2023/03/25(土) 17:24:06.36 ID:hUI94gGa 合わせて手動アンロールも少し修正 int64_t __attribute__ ((noinline)) simple_unroll4(std::vector<uint> const &data) { int64_t sum = 0; size_t const size = data.size(); size_t i = 0; size_t const overflow_safe_chunk_size = (1ULL<< (8*sizeof(uint)))/(1ULL<<8); // 0xff = (1<<8)-1 for(size_t ichunk = 0; ichunk < size ; ichunk += overflow_safe_chunk_size){ uint sub[4]{}; for ( ; i < ichunk; i+=4) { if (128 <= data[i+0]) sub[0] += data[i+0]; if (128 <= data[i+1]) sub[1] += data[i+1]; if (128 <= data[i+2]) sub[2] += data[i+2]; if (128 <= data[i+3]) sub[3] += data[i+3]; } sum += sub[0]+sub[1]+sub[2]+sub[3]; } for ( ; i < size; i+=1) { if (128 <= data[i]) sum += data[i]; } return sum; } gccとclangでかなりの違いが出てるのでSIMD intrinsicsで書くべきなんだろうけど そこまでするとM1/M2で使えなくなるのでこの辺が落としどころ? http://mevius.5ch.net/test/read.cgi/tech/1658762410/816
817: デフォルトの名無しさん [sage] 2023/03/26(日) 11:02:32.91 ID:4Q+hammq >>816 Qiitaでやればいいのに、、まさか本人か? 叩かれるのが厭だからこっちにきてグダグダやってんのか http://mevius.5ch.net/test/read.cgi/tech/1658762410/817
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.032s