【統計分析】機械学習・データマイニング27 (38レス)
上下前次1-新
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
31: 2022/03/13(日)22:13 ID:6Ds930NS(1) AAS
『スッキリわかるPythonによる機械学習入門』という本で、外れ値を削除しています。
特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、
x軸を'SNS1'、y軸を'sales'とした散布図
x軸を'SNS2'、y軸を'sales'とした散布図
x軸を'actor'、y軸を'sales'とした散布図
x軸を'original'、y軸を'sales'とした散布図
の4つの散布図を描いています。
そして、
x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。
その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。
このやり方に疑問を持っています。
外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。
'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。
この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
32: 2022/03/14(月)11:36 ID:6DbrPlzA(1/2) AAS
model.score(x = x_test, y = y_test)
を実行するとエラーがでますが、
model.score(X = x_test, y = y_test)
とするとエラーがでません。
model.score(X = x_test, Y = y_test)
とするとやはりエラーがでます。
これはなぜですか?
33(1): 2022/03/14(月)13:10 ID:TgkC28rK(1) AAS
引数名がそう定められてるから
34: 2022/03/14(月)13:35 ID:6DbrPlzA(2/2) AAS
>>33
ありがとうございます。
なぜ、エックスは「X」大文字で、ワイは「y」と小文字なんでしょうか?
35: 2022/03/16(水)16:59 ID:ekpgiyg1(1) AAS
『スッキリわかるPythonによる機械学習入門』という本ですが、外れ値の選定がいい加減すぎるように思います。
外れ値は本当に人間が選定するのでしょうか?
それこそ、機械学習で外れ値を選定するというのが合理的であるように思うのですが。
36: 2023/03/01(水)18:25 ID:nUGZrS0Q(1) AAS
恋とは自分本位のもの愛とは相手本位のもの
37: 2023/07/31(月)12:09 ID:6FtARTFk(1) AAS
ゲホゴホ Oo。(▼o▼;)y-゜゜゜ カッコツケスギタカ・・・
38: 2023/09/30(土)20:54 ID:EbKCaSNj(1) AAS
あんた、やるやん。
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.005s