10GBのCSVファイルのソートが遅いのはなぜですか? (49レス)
上下前次1-新
1(5): デフォルトの名無しさん [sage] 2023/06/12(月) 21:20:45.91 ID:F1HJC183(1) AAS
CSVファイルは検索が速いって聞きました
ではなぜソートが遅いのでしょうか?
2: デフォルトの名無しさん [] 2023/06/13(火) 08:52:56.97 ID:JBnp9ago(1) AAS
べ、べつに遅くないし!
3: デフォルトの名無しさん [sage] 2023/06/13(火) 09:49:32.67 ID:Xu7LyXF8(1) AAS
>>1君がバカなのは何故ですか
って言われて答えられないでしょうそれと同じ
4: デフォルトの名無しさん [] 2023/06/13(火) 09:53:59.11 ID:meEyuUg2(1) AAS
マジレスしとくと
スレタイの "10GB" と >>1 の質問が無関係だな
5: デフォルトの名無しさん [sage] 2023/06/13(火) 13:36:34.95 ID:4HUnX0Fj(1) AAS
さっき霊魂を見たんですが、どうしたらいいですか
6: デフォルトの名無しさん [sage] 2023/06/13(火) 16:18:52.30 ID:u7AmJNUj(1) AAS
「…見なかったことにしといてやる!」と宣言すればおけ
7: デフォルトの名無しさん [sage] 2023/06/13(火) 19:37:20.82 ID:ixSRP7mF(1) AAS
よかろう、ならばビットマップファイルだ
8: デフォルトの名無しさん [sage] 2023/06/22(木) 06:41:18.88 ID:k/qBouFf(1) AAS
>>1
それは ヒ・ミ・ツ。
フフフッ…
9: デフォルトの名無しさん [] 2023/06/29(木) 13:51:47.41 ID:IO1TL2jD(1) AAS
10GBだから
10: デフォルトの名無しさん [] 2023/06/30(金) 03:16:09.95 ID:KO9roK1Y(1) AAS
昭∞!!!!
大∞!!!!!
昇∞!!!!!!
漠∞!!!!!!!
11(1): デフォルトの名無しさん [] 2023/08/09(水) 07:21:27.86 ID:Bb1AJAu+(1) AAS
>>1
速いと感じるか遅いと感じるかは個人の感覚の問題
何秒なら速いのか、何と比較して速いのか
他人が遅いというから遅いとか小学生かよ
12: デフォルトの名無しさん [] 2023/08/09(水) 07:46:15.85 ID:Aj0Whal0(1/2) AAS
>>11
じゃあ君は速いとでも?w
13: デフォルトの名無しさん [] 2023/08/09(水) 07:47:25.44 ID:Aj0Whal0(2/2) AAS
CSVのソートが遅いのは社会的共同体の中で自然に共有されうる普遍的事実である
14: デフォルトの名無しさん [sage] 2023/08/09(水) 10:35:23.16 ID:ZMTba8c6(1) AAS
まぁRDBMS使った方がいいわな
15: デフォルトの名無しさん [] 2023/08/09(水) 11:06:02.05 ID:qEKEd4/l(1) AAS
何をつかっても遅いものは遅いw
16: デフォルトの名無しさん [sage] 2023/08/09(水) 15:27:00.04 ID:a25ApkGr(1) AAS
実装次第で遅くなりそうなケースだな
フレームワークとコピペだけで戦ってきたやつには荷が重いだろう
17: デフォルトの名無しさん [sage] 2023/08/09(水) 16:22:02.52 ID:coMLMuQp(1) AAS
jsonやmessagepackよりは速いかも知れないな
18(1): デフォルトの名無しさん [] 2023/08/10(木) 00:02:20.56 ID:gjwqjVE1(1) AAS
10GBはファイルの大きさであって、データの件数ではないんだよな
19: デフォルトの名無しさん [sage] 2023/08/10(木) 01:18:52.99 ID:qMn8aig+(1) AAS
10GB のデータをソートするには、
並べ替えた途中経過のデータも持っておく必要があるから、
100GBぐらいのメモリが必要なのでは?
メモリが少ないと、途中経過のデータをハードディスクに保存して、
メモリを空けないといけない。スワップ
20(1): デフォルトの名無しさん [] 2023/08/10(木) 01:20:23.88 ID:lIBN6+0k(1) AAS
>>18
レコード数を3とする、ソートせよ
21: デフォルトの名無しさん [] 2023/08/10(木) 02:07:49.13 ID:ljCEt4I+(1) AAS
ソートのキーだけでいい
22: デフォルトの名無しさん [sage] 2023/08/10(木) 10:55:32.60 ID:AypbHuiV(1) AAS
メモリーに乗りそうな大きさに分割してソートして
それをマージソートするのが一番早いんじゃね?
23: デフォルトの名無しさん [] 2023/08/10(木) 11:29:41.03 ID:YYBOmFjO(1/2) AAS
>>20
レコード数が1でソートの必要がないかも知れない。
24: デフォルトの名無しさん [] 2023/08/10(木) 11:33:16.87 ID:YYBOmFjO(2/2) AAS
>>1
検索早くないのでは?要するにただのテキストの塊なので grep コマンドとか使って検索できるってだけのことで、その状態ではインデックスなしの全検索だから遅くなると思う。
25: デフォルトの名無しさん [] 2023/08/10(木) 20:54:16.43 ID:TWiH3Zx3(1) AAS
10GBのファイルを書き換えながらソートしているのかな?
上下前次1-新書関写板覧索設栞歴
あと 24 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.302s*