【統計分析】機械学習・データマイニング27 (38レス)
上
下
前
次
1-
新
31
: 2022/03/13(日)22:13
ID:6Ds930NS(1)
AA×
[
240
|
320
|480|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
31: [] 2022/03/13(日) 22:13:14.92 ID:6Ds930NS 『スッキリわかるPythonによる機械学習入門』という本で、外れ値を削除しています。 特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、 x軸を'SNS1'、y軸を'sales'とした散布図 x軸を'SNS2'、y軸を'sales'とした散布図 x軸を'actor'、y軸を'sales'とした散布図 x軸を'original'、y軸を'sales'とした散布図 の4つの散布図を描いています。 そして、 x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。 その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。 このやり方に疑問を持っています。 外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。 'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。 この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか? http://mevius.5ch.net/test/read.cgi/tech/1578890891/31
スッキリわかるによる機械学習入門という本で外れ値を削除しています 特徴量が で目的変数がのデータがあって 軸を軸をとした散布図 軸を軸をとした散布図 軸を軸をとした散布図 軸を軸をとした散布図 のつの散布図を描いています そして 軸を軸をとした散布図を見てポツンと他の点から離れたデータを外れ値としています その外れ値はの値が同じである他の点と比べての値が非常に小さいです このやり方に疑問を持っています 外れ値とされた点のの値が小さいのは例えばの値が非常に小さい悪い値であるからかもしれません の値が非常に悪い値ならばの値が小さくても何も不自然じゃないわけです この本のように特徴量のつを軸に目的変数を軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 7 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.043s