[過去ログ] くだすれPython(超初心者用) その48【まず1嫁】 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
785
(6): デフォルトの名無しさん [] 2020/07/12(日) 18:23:41.86 ID:9lwq43sw(1/5) AAS
大量のデータ3000万行ぐらいのcsvファイルを二つ読み込み
1列目をキーとし、共通する値を片方のcsvに加えようとしています。

それぞれ、
open("test.csv","w")で読みこみ、
それぞれをdictに格納し、dict1でループ。
キーを
if key in dict2
で探しています。
これを高速化するとしたらどのような方法がありますでしょうか。
787: 785 [] 2020/07/12(日) 18:44:34.96 ID:9lwq43sw(2/5) AAS
>>786
joinで出力するイメージでしょうか。
そちらの方が早いって事ですよね
ありがとうございます。
788: デフォルトの名無しさん [sage] 2020/07/12(日) 19:26:48.34 ID:ZqI/7j2D(1) AAS
>>785
3000万でcsvの時点でもう色々駄目だろ、DB使えよ
791
(2): デフォルトの名無しさん [sage] 2020/07/12(日) 19:36:50.58 ID:zNwkT4YV(3/4) AAS
>>785
メモリがやばいだろうから
pandas印のストローで少しずつちゅるちゅるしていってね!
795
(1): 785 [] 2020/07/12(日) 20:58:08.19 ID:9lwq43sw(4/5) AAS
すみませんいろいろ間違えました
>>794
>>791です
798
(1): 785 [] 2020/07/12(日) 23:35:38.80 ID:9lwq43sw(5/5) AAS
pandas でグループ毎にカウントと
そのグループ毎に列指定でsumをとったものを同じpandas.dataframeで
集計することはできますでしょうか

>>797ありがとうございます。
800: 785 [] 2020/07/13(月) 00:08:26.04 ID:uDtGxDQx(1/2) AAS
>>799
ありがとうござます。
group した値とは別の値をsumするにはどうすればよいでしょうか
df3.groupby(['a','b']).agg({'count','sum'})
でsumで取得したいのはc列です。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.040s