[過去ログ] 【統計分析】機械学習・データマイニング30 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
677(2): (ワッチョイ cf73-9b/0 [153.200.72.220]) 2021/06/10(木)22:27 ID:uEixJvyy0(1) AAS
書籍「Kaggleで勝つデータ分析の技術」の内容について教えてください。
この書籍のサンプルコード内のコメントについてです。
・第4章「分析コンペ用のクラスやフォルダの構成」サンプルコード
外部リンク[py]:github.com
・183行目のコメント抜粋
「# 毎回train.csvを読み込むのは効率が悪いため、データに応じて適宜対応するのが望ましい(他メソッドも同様)」
「効率が悪い」というのは、速度の遅さだと思うのですが、
「データに応じて適宜対応」とは、具体的にどんな対応があるのでしょうか?
CSVからデータベース(mysql)などに移しておく?くらいしか思いつかないもので・・・。
もしお分かりになる方見えましたらお願いいたします。
678(1): (ワッチョイ cf10-iygP [153.131.102.129]) 2021/06/10(木)22:55 ID:bFpC+A1+0(1) AAS
>>677
毎回読み込むのが効率悪いって意味かと
読み込む必要がないデータは読み込まなくて済む
データを読み込んだ後で変更やデータクリアとかしてなければ再利用できるのでは?
680(1): (ワッチョイ 538f-/CYF [122.30.61.36]) 2021/06/10(木)23:05 ID:r65EV/M/0(1) AAS
>>677
単純にクロスバリデーションの度に読み込み処理が入ってるからって事でしょ。
メモリ上に保持しとけばいいんじゃないの
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.035s