[過去ログ] 【統計分析】機械学習・データマイニング20 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
225
(5): (ササクッテロ Spf1-Mm8o) 2018/08/30(木)14:31 ID:Aa6QMEJ0p(2/3) AAS
>>221
ほんとはめっちゃ詳しく書きたいけど誰が見てるから分からないから凄く端折ってるけど今はある装置のトラブル要因を調べてる
データは特徴量が200個あって1万レコードくらいある
ただこの装置自体は見たことがなくて装置自体の知見も浅い分野だからデータセットは理解できてない
明らかに要らなそうなデータは消して特徴量を選択して決定木にかけて、重要な特徴量に対してペアプロットを出すところまでは来た
プロットの結果は分類自体がほぼ出来ていなくて、唯一差が見れそうなところに見てみようと思ったんだけど、
結局そこはどこどこの数値が高くなると異常が出やすい、くらいの説明しか出来なくてその値がなぜ高くなるかを見つけ出すべきなんだろうけどデータや機構が分からなくて何から手をつけて良いか分からないってところで止まってる
こんなのは多分現場の人は感覚的に分かってる話だから何の意味もないよね
229: (ワッチョイ 65b3-j9mh) 2018/08/30(木)16:44 ID:NY8GEmPq0(2/2) AAS
>>225
ああそういう話だとさっきの本は関係ないや
ビジネスの何に使えばいいかわからない
的な意味だと思ったんで
230
(2): (ワッチョイ 351e-J7KC) 2018/08/30(木)17:17 ID:lMDVbSRW0(1/2) AAS
>>225
>データは特徴量が200個あって1万レコードくらいある
直感的に、少なくない?

>ただこの装置自体は見たことがなくて装置自体の知見も浅い分野だからデータセットは理解できてない
それが問題じゃん。装置自体調べろよ。
ていうか物理現象を調べてるのか?
なら機械学習を使う意味があるのかがそもそもわからんな
しいていうなら相関の強いものを上から順に並べるとか
ヒステリシスを持っている可能性を考慮するために、プロット上げる方向と下げる方向を別変数にしたほうがいいかも
243: (マクド FFe1-J7KC) 2018/08/31(金)20:20 ID:1Ee7C22hF(1/2) AAS
>>225
装置の故障に関係のある特徴量を調べたいだけなら
ランダムフォレストではなく、もっと別の識別器を使った方がいいんじゃないか
245: (ワッチョイ 8da5-Mm8o) 2018/09/02(日)16:06 ID:qpc9/9Oc0(1/2) AAS
>>225 です
レスくれた人ほんとにありがとう

一応自分では>>240で出した結果から重要度が高いものに対して>>238を出すところまではやってみた
ただ特徴量の選択だったり、自分で特徴量を増やしたりする必要がある可能性があったけどその辺が不十分だから正常時と不良時の変化は捉えきれなかった
急ぎの案件ではないから装置に詳しい人にもっと詳細に聞いてから見直してみる
252: (ブーイモ MM43-HIeS) 2018/09/03(月)08:17 ID:EloH5MrPM(1) AAS
自分も>>230の通り装置自体の理解が先だと思う

つーかkaggleしかやったことのない新卒を現場に出すと
大抵 >>225 みたいになるので笑える

225は素直だしやる気もありそうだから大成すんじゃない?
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.034s