[過去ログ] Pythonのお勉強 Part73 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
966(1): (ワッチョイ ff32-uXkv) 2024/09/17(火)10:56 ID:bvtQXCJ00(1/4)調 AAS
複数のエクセルファイルから特定列のデータを抜き出して
新たにエクセルファイルにまとめて書き出すということをしたのですが、
複数ファイルには重複する行が含まれていて、
下記の2つを試したのですがどちらも欠損データが生じました。
1.listに一旦全部入れて、最終的にsetに一旦変換してlistに戻す
2.1行ごとに最終的なリストに含まれていない要素をチェックしながら追加
データは5列で最終的に重複処理したもので300行程度、
重複処理前でも2000行余りぐらいのデータです。
最終的にpandasで全部一旦追加した後df.drop_duplicates()にて処理して問題なく処理されたのですが
下記の方法で欠損することとかあり得るのでしょうか?
968(1): (ワッチョイ 1779-0tQg) 2024/09/17(火)12:16 ID:rwC9vNLN0(3/3)調 AAS
>>966
各列をそれぞれlistにしてsetにしたのか?
それだと各列ごとに重複削除するから行レベルでは重複してないものも消えそうだが
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.036s