[過去ログ]
【統計分析】機械学習・データマイニング30 (1002レス)
【統計分析】機械学習・データマイニング30 http://mevius.5ch.net/test/read.cgi/tech/1609459855/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
677: デフォルトの名無しさん (ワッチョイ cf73-9b/0 [153.200.72.220]) [] 2021/06/10(木) 22:27:02 ID:uEixJvyy0 書籍「Kaggleで勝つデータ分析の技術」の内容について教えてください。 この書籍のサンプルコード内のコメントについてです。 ・第4章「分析コンペ用のクラスやフォルダの構成」サンプルコード https://github.com/ghmagazine/kagglebook/blob/master/ch04-model-interface/code/runner.py ・183行目のコメント抜粋 「# 毎回train.csvを読み込むのは効率が悪いため、データに応じて適宜対応するのが望ましい(他メソッドも同様)」 「効率が悪い」というのは、速度の遅さだと思うのですが、 「データに応じて適宜対応」とは、具体的にどんな対応があるのでしょうか? CSVからデータベース(mysql)などに移しておく?くらいしか思いつかないもので・・・。 もしお分かりになる方見えましたらお願いいたします。 http://mevius.5ch.net/test/read.cgi/tech/1609459855/677
678: デフォルトの名無しさん (ワッチョイ cf10-iygP [153.131.102.129]) [] 2021/06/10(木) 22:55:34 ID:bFpC+A1+0 >>677 毎回読み込むのが効率悪いって意味かと 読み込む必要がないデータは読み込まなくて済む データを読み込んだ後で変更やデータクリアとかしてなければ再利用できるのでは? http://mevius.5ch.net/test/read.cgi/tech/1609459855/678
680: デフォルトの名無しさん (ワッチョイ 538f-/CYF [122.30.61.36]) [sage] 2021/06/10(木) 23:05:38 ID:r65EV/M/0 >>677 単純にクロスバリデーションの度に読み込み処理が入ってるからって事でしょ。 メモリ上に保持しとけばいいんじゃないの http://mevius.5ch.net/test/read.cgi/tech/1609459855/680
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.033s