Qiita 2 - キータぞ、来たぞ、キータだぞー

[過去ﾛｸﾞ] Qiita 2 - キータぞ、来たぞ、キータだぞー (1002ﾚｽ)
上下前次1-新
通常表示 512ﾊﾞｲﾄ分割ﾚｽ栞
抽出解除ﾚｽ栞

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

813: 812 [sage] 2023/03/25(土) 06:46:24.02 ID:kHu8aUGB

失礼、measure関数で1000回ループしてたので、高々10G回の足し算になってた
でもO3最適化が何かをやっているようだ

g++ -O2 -mavx2
shuffled
simple: duration= 4.3088s  sum=957487744000
simple_unroll4: duration= 1.5359s  sum=957487744000
foreach: duration= 4.3084s  sum=957487744000
opt-simple: duration= 4.7163s  sum=957487744000
opt-foreach: duration= 5.5201s  sum=957487744000

g++ -O3 -mavx2
shuffled
simple: duration= 1.4113s  sum=957487744000
simple_unroll4: duration= 0.0016s  sum=957487744000
foreach: duration= 1.4264s  sum=957487744000
opt-simple: duration= 1.4410s  sum=957487744000
opt-foreach: duration= 1.4378s  sum=957487744000

int64_t __attribute__ ((noinline)) simple_unroll4(std::vector<uint> const &data)
{
int64_t sum[4]{};
for (size_t i = 0, size = data.size(); i < size; i+=4)
{
if (128 <= data[i+0]) sum[0] += data[i+0];
if (128 <= data[i+1]) sum[1] += data[i+1];
if (128 <= data[i+2]) sum[2] += data[i+2];
if (128 <= data[i+3]) sum[3] += data[i+3];
}
return sum[0]+sum[1]+sum[2]+sum[3];
}

http://mevius.5ch.net/test/read.cgi/tech/1658762410/813

815: 812 [sage] 2023/03/25(土) 17:13:39.86 ID:hUI94gGa

uint16_tにしたら続編のAVX512と似通ったレベルが出た(続編のsumがmacとwindowsで違うのは何故？)
g++ -O3 (avx2を明示しない方が速かった)
shuffled
simple: duration= 1.0470s  sum=957487744000
simple_unroll4: duration= 0.7678s  sum=957487744000 ★
foreach: duration= 1.0765s  sum=957487744000
opt-simple: duration= 1.3134s  sum=957487744000
opt-foreach: duration= 1.3262s  sum=957487744000
sorted
simple: duration= 1.0430s  sum=957487744000
simple_unroll4: duration= 0.7652s  sum=957487744000 ★
foreach: duration= 1.0726s  sum=957487744000
opt-simple: duration= 1.3084s  sum=957487744000
opt-foreach: duration= 1.3201s  sum=957487744000

clang++ -O3 -mavx2 (avx2を明示)
shuffled
simple: duration= 0.8695s  sum=957487744000
simple_unroll4: duration= 1.3842s  sum=957487744000
foreach: duration= 0.8715s  sum=957487744000
opt-simple: duration= 0.8683s  sum=957487744000
opt-foreach: duration= 0.8636s  sum=957487744000 ★
sorted
simple: duration= 0.8812s  sum=957487744000
simple_unroll4: duration= 1.3900s  sum=957487744000
foreach: duration= 0.8701s  sum=957487744000
opt-simple: duration= 0.8691s  sum=957487744000
opt-foreach: duration= 0.8682s  sum=957487744000 ★

http://mevius.5ch.net/test/read.cgi/tech/1658762410/815

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.031s