[過去ログ]
【統計分析】機械学習・データマイニング21 (1002レス)
【統計分析】機械学習・データマイニング21 http://mevius.5ch.net/test/read.cgi/tech/1541309676/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
301: デフォルトの名無しさん (ワッチョイ 5a97-ad2z) [sage] 2018/11/30(金) 02:11:39.26 ID:gAFwEIHo0 交差検証についてなんですが、例えばアイリスデータでSVMで3分割の交差検証した時(3分割の平均が)94%〜97%ぐらいばらつきがあると思うのですが3分割の平均をさらに100回の平均とかして評価するって感じでいいんですかね? http://mevius.5ch.net/test/read.cgi/tech/1541309676/301
304: デフォルトの名無しさん (ワッチョイ 5a97-ad2z) [sage] 2018/11/30(金) 08:44:44.60 ID:gAFwEIHo0 >>303 研究とかで発表するときはどういう値を使ってるのですか? http://mevius.5ch.net/test/read.cgi/tech/1541309676/304
306: デフォルトの名無しさん (ワッチョイ 5a97-ad2z) [sage] 2018/11/30(金) 13:00:06.59 ID:gAFwEIHo0 例えばkaggleとかなら初めからトレーニングデータとテストデータが分かれててテストデータとの答え合せで数値としての精度を用いてます。 自分で1つのデータを用いて精度を出したいときに、データが少なくてテストデータの選ばれ方にかなり影響を受けるというようなとときにはどういう風な値を用いればいいのかっていうのが聞きたいです。 http://mevius.5ch.net/test/read.cgi/tech/1541309676/306
307: デフォルトの名無しさん (ワッチョイ 5a97-ad2z) [sage] 2018/11/30(金) 13:02:03.08 ID:gAFwEIHo0 >>306 テストデータの選ばれ方によって予測精度が全然違うみたいな時です。 http://mevius.5ch.net/test/read.cgi/tech/1541309676/307
309: デフォルトの名無しさん (ワッチョイ 5a97-ad2z) [sage] 2018/11/30(金) 16:23:37.26 ID:gAFwEIHo0 扱ってるデータの性質上データ数が少ないのは仕方ないのです… 今書いてるコードなんですが、 sklearnのcross_val_scoreでcvパラメータに層化分割を渡してます。(StratifiedKFold(n_splits=3, shuffle=True) これでfor文で例えば100回回すと3つセットのスコアが100個出てきますよね?それで3値の平均のさらに100個の平均って感じで評価基準にしてます。3つセットのスコアの分散がそこそこ大きいのは仕方ないと思ってます。 これで良いのですかね。 http://mevius.5ch.net/test/read.cgi/tech/1541309676/309
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.048s