10GBのCSVファイルのソートが遅いのはなぜですか? (49レス)
10GBのCSVファイルのソートが遅いのはなぜですか? http://mevius.5ch.net/test/read.cgi/tech/1686572445/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
17: デフォルトの名無しさん [sage] 2023/08/09(水) 16:22:02.52 ID:coMLMuQp jsonやmessagepackよりは速いかも知れないな http://mevius.5ch.net/test/read.cgi/tech/1686572445/17
18: デフォルトの名無しさん [] 2023/08/10(木) 00:02:20.56 ID:gjwqjVE1 10GBはファイルの大きさであって、データの件数ではないんだよな http://mevius.5ch.net/test/read.cgi/tech/1686572445/18
19: デフォルトの名無しさん [sage] 2023/08/10(木) 01:18:52.99 ID:qMn8aig+ 10GB のデータをソートするには、 並べ替えた途中経過のデータも持っておく必要があるから、 100GBぐらいのメモリが必要なのでは? メモリが少ないと、途中経過のデータをハードディスクに保存して、 メモリを空けないといけない。スワップ http://mevius.5ch.net/test/read.cgi/tech/1686572445/19
20: デフォルトの名無しさん [] 2023/08/10(木) 01:20:23.88 ID:lIBN6+0k >>18 レコード数を3とする、ソートせよ http://mevius.5ch.net/test/read.cgi/tech/1686572445/20
21: デフォルトの名無しさん [] 2023/08/10(木) 02:07:49.13 ID:ljCEt4I+ ソートのキーだけでいい http://mevius.5ch.net/test/read.cgi/tech/1686572445/21
22: デフォルトの名無しさん [sage] 2023/08/10(木) 10:55:32.60 ID:AypbHuiV メモリーに乗りそうな大きさに分割してソートして それをマージソートするのが一番早いんじゃね? http://mevius.5ch.net/test/read.cgi/tech/1686572445/22
23: デフォルトの名無しさん [] 2023/08/10(木) 11:29:41.03 ID:YYBOmFjO >>20 レコード数が1でソートの必要がないかも知れない。 http://mevius.5ch.net/test/read.cgi/tech/1686572445/23
24: デフォルトの名無しさん [] 2023/08/10(木) 11:33:16.87 ID:YYBOmFjO >>1 検索早くないのでは?要するにただのテキストの塊なので grep コマンドとか使って検索できるってだけのことで、その状態ではインデックスなしの全検索だから遅くなると思う。 http://mevius.5ch.net/test/read.cgi/tech/1686572445/24
25: デフォルトの名無しさん [] 2023/08/10(木) 20:54:16.43 ID:TWiH3Zx3 10GBのファイルを書き換えながらソートしているのかな? http://mevius.5ch.net/test/read.cgi/tech/1686572445/25
26: デフォルトの名無しさん [sage] 2023/08/13(日) 12:14:40.57 ID:mxfdwtiA Diskのデフラグ並みだな http://mevius.5ch.net/test/read.cgi/tech/1686572445/26
27: デフォルトの名無しさん [sage] 2023/08/16(水) 10:29:29.77 ID:g5j2pEtW ゲッ!!(/||| ̄▽)y-ξ⌒◇ヾ( ̄  ̄;)ジュッ http://mevius.5ch.net/test/read.cgi/tech/1686572445/27
28: デフォルトの名無しさん [sage] 2023/08/27(日) 20:18:09.89 ID:m39XqcII ( Д ) ゚ ゚ http://mevius.5ch.net/test/read.cgi/tech/1686572445/28
29: デフォルトの名無しさん [sage] 2023/09/01(金) 20:23:04.85 ID:MSzaVfqT どないやねん、意味がわからん http://mevius.5ch.net/test/read.cgi/tech/1686572445/29
30: デフォルトの名無しさん [] 2023/09/12(火) 12:29:39.47 ID:QOX8wfhQ 何行何列か示せと http://mevius.5ch.net/test/read.cgi/tech/1686572445/30
31: デフォルトの名無しさん [] 2023/09/12(火) 12:38:34.37 ID:A3YXlMvb >>30 1億行、125列 http://mevius.5ch.net/test/read.cgi/tech/1686572445/31
32: デフォルトの名無しさん [sage] 2023/09/12(火) 12:46:05.28 ID:DJD1APYm こんな頭の悪いスレ上げるのはなぜですか? http://mevius.5ch.net/test/read.cgi/tech/1686572445/32
33: デフォルトの名無しさん [] 2023/09/12(火) 14:42:44.77 ID:A3YXlMvb なぜ下げるんだい? http://mevius.5ch.net/test/read.cgi/tech/1686572445/33
34: デフォルトの名無しさん [sage] 2023/09/12(火) 14:59:33.38 ID:BQ9Iu4K/ なんで10GBもあるデータをCSVで管理しようと思ったんだろうな http://mevius.5ch.net/test/read.cgi/tech/1686572445/34
35: デフォルトの名無しさん [] 2023/09/12(火) 17:11:08.62 ID:zmLL4dpk 10GBもあるデータをCSVにしようとした訳ではなく 何も考えずにCSVで管理してたらいつの間にか10GBになったんだろう http://mevius.5ch.net/test/read.cgi/tech/1686572445/35
36: デフォルトの名無しさん [sage] 2023/09/12(火) 18:09:26.28 ID:BQ9Iu4K/ そっかw http://mevius.5ch.net/test/read.cgi/tech/1686572445/36
37: デフォルトの名無しさん [] 2023/09/14(木) 15:11:27.86 ID:Ur1UGoF9 >>31 俺だったらなんでも良いからまずRDBに入れちゃうかも。 内容にもよるだろうが、とりあえずSQLiteとかな。 http://mevius.5ch.net/test/read.cgi/tech/1686572445/37
38: デフォルトの名無しさん [] 2023/09/15(金) 19:50:24.13 ID:V4ggyvBY 巨大なデータをSQLiteで処理するためのメモ https://fanぶろぐs.jp/scripts/archive/11/0 http://mevius.5ch.net/test/read.cgi/tech/1686572445/38
39: デフォルトの名無しさん [sage] 2023/09/15(金) 20:30:51.52 ID:mLRMgWkC やさいい http://mevius.5ch.net/test/read.cgi/tech/1686572445/39
40: デフォルトの名無しさん [sage] 2023/09/27(水) 20:16:21.16 ID:PKUrAitV まず各ブロック当たり1000行とかに分ける。ブロック単位でソートする。 1.ブロックA/B を連結してAB間でソート。 B=全体の数/2 2.ブロックA+1, B+1 で連結してソート 3. ブロックA+全体の数/2- 1(前半最後まで)、ブロックB+前半最後までを連結してソート 4.今度は全体の前半で1-3 風にブロックソート。後半〜最後までで1-3 風にブロックソート 5. 前半〜前半+3/4 でブロックソート、前半+2/4〜前半+4/4 でブロックソート、 ...... ・・・・ ってのを大昔 BASIC で作ったのですが、なぜかデータがゼロに なってしまうバグが出て作るのを止めてしまいました。ちゃんちゃん。駄目じゃん俺。 http://mevius.5ch.net/test/read.cgi/tech/1686572445/40
41: デフォルトの名無しさん [] 2023/10/04(水) 21:29:03.45 ID:ja1//dn8 だいたいデータの入れ替えに時間が掛かるんだよな メディアがHDDとかだと尚更 普通はインデックスで実データを間接参照させるんだが まあ、やって無いんだろうなぁ http://mevius.5ch.net/test/read.cgi/tech/1686572445/41
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 8 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.013s