レス書き込み
スレへ戻る
写
レス栞
レス消
【統計分析】機械学習・データマイニング27
PC,スマホ,PHSは
ULA
べっかんこ
公式(スマホ)
公式(PC)
で書き込んでください。
名前
メール
引用切替:
レスアンカーのみ
>>31 > 『スッキリわかるPythonによる機械学習入門』という本で、外れ値を削除しています。 > > 特徴量が、'SNS1', 'SNS2', 'actor', 'original'で、目的変数が'sales'のデータがあって、 > > x軸を'SNS1'、y軸を'sales'とした散布図 > x軸を'SNS2'、y軸を'sales'とした散布図 > x軸を'actor'、y軸を'sales'とした散布図 > x軸を'original'、y軸を'sales'とした散布図 > > の4つの散布図を描いています。 > > そして、 > > x軸を'SNS2'、y軸を'sales'とした散布図を見て、ポツンと他の点から離れたデータを外れ値としています。 > > その外れ値は、'SNS2'の値が同じである他の点と比べて、'sales'の値が非常に小さいです。 > > このやり方に疑問を持っています。 > > 外れ値とされた点の'sales'の値が小さいのは、例えば、'actor'の値が非常に小さい(悪い)値であるからかもしれません。 > 'actor'の値が非常に悪い値ならば、'sales'の値が小さくても何も不自然じゃないわけです。 > > この本のように、特徴量の1つをx軸に、目的変数をy軸にしてあるデータが外れデータかどうか判断するというのは意味があるんですか?
ローカルルール
SETTING.TXT
他の携帯ブラウザのレス書き込みフォームはこちら。
書き込み設定
で書き込みサイトの設定ができます。
・
ULA
・
べっかんこ(身代わりの術)
・
べっかんこ(通常)
・
公式(スマホ)
・
公式(PC)[PC,スマホ,PHS可]
書き込み設定(板別)
で板別の名前とメールを設定できます。
メモ帳
(0/65535文字)
上
下
板
覧
索
設
栞
歴
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.302s*