【統計分析】機械学習・データマイニング30

[過去ﾛｸﾞ] 【統計分析】機械学習・データマイニング30 (1002ﾚｽ)
上下前次1-新
抽出解除ﾚｽ栞

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

ﾘﾛｰﾄﾞ規制です｡10分ほどで解除するので､他のﾌﾞﾗｳｻﾞへ避難してください｡

677(2): (ﾜｯﾁｮｲ cf73-9b/0 [153.200.72.220]) 2021/06/10(木)22:27 ID:uEixJvyy0(1) AAS
書籍「Kaggleで勝つデータ分析の技術」の内容について教えてください。
この書籍のサンプルコード内のコメントについてです。

・第4章「分析コンペ用のクラスやフォルダの構成」サンプルコード
外部ﾘﾝｸ[py]:github.com

・183行目のコメント抜粋
「# 毎回train.csvを読み込むのは効率が悪いため、データに応じて適宜対応するのが望ましい（他メソッドも同様）」

「効率が悪い」というのは、速度の遅さだと思うのですが、
「データに応じて適宜対応」とは、具体的にどんな対応があるのでしょうか？

CSVからデータベース(mysql)などに移しておく？くらいしか思いつかないもので・・・。

もしお分かりになる方見えましたらお願いいたします。

678(1): (ﾜｯﾁｮｲ cf10-iygP [153.131.102.129]) 2021/06/10(木)22:55 ID:bFpC+A1+0(1) AAS
>>677
毎回読み込むのが効率悪いって意味かと
読み込む必要がないデータは読み込まなくて済む
データを読み込んだ後で変更やデータクリアとかしてなければ再利用できるのでは？

680(1): (ﾜｯﾁｮｲ 538f-/CYF [122.30.61.36]) 2021/06/10(木)23:05 ID:r65EV/M/0(1) AAS
>>677
単純にクロスバリデーションの度に読み込み処理が入ってるからって事でしょ。

メモリ上に保持しとけばいいんじゃないの

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ

ぬこの手ぬこTOP 0.035s