[過去ログ] 【統計分析】機械学習・データマイニング21 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
700(2): (アウアウイー Sa35-J3Xo) 2018/12/28(金)18:47 ID:3Bc3qTdBa(1/6) AAS
ここに書いてある中で、一つだけ賛成できないのは
データ(分析対象になるデータ)の件。
それこそ、生の形でデータを受取り分析者側で加工から
やることが私は必要だと思っている。
そもそも顧客のデータを信じるところから始めてはいけない。
今は、ネットのデータだったり、データが集まりやすいし
さらにデータベース化されているケースが多い。
それに甘んじたまま分析に入ろうとする人が多いのは
私は疑問。
701(2): (ワッチョイ 7d98-4fyn) 2018/12/28(金)19:07 ID:Nt5XO8IQ0(9/19) AAS
>>700
どれに対して言ってるのか知らないけど
機械学習はデータをコンピュータを使って高速に演算するものなんだから、
データが重要なのは当たり前だよ。
でも "機械学習" ではないけどね。俺が機械学習に興味が薄いのは
結局最後にはデータをどうするか?の話になってしまうのがわかってるから。
機械学習のアルゴリズムがーではなく、○○データを加えることで精度がー。とかいう流れになる
行き着く先は、データの売買ビジネスだよ。
今はデータが有るようで無いからね。
例えば売上データはあるが、あるのは売上データだけだ。コンビニとか
年齢層入力してる(してた?)が曖昧だし、ポイントカードで情報抜き取る必要があるが
全員抜き取れるわけじゃないし、別の店で買う場合もある(つまり売れるはずの商品がわからない)
精度をあげるためのデータがわかってる。だけどそれらを集めるには
他社と協力していろんなデータを集めて統合しなければいけない
個人情報の保護がある時点で難しいし、ライバル会社と協力なんかしないだろ?w
となると第三者のデータ売買会社からデータを買うことになる。
その始まりの姿がTポイントカードだろう
702(1): (ワッチョイ 7d98-4fyn) 2018/12/28(金)19:13 ID:Nt5XO8IQ0(10/19) AAS
>>700
> 今は、ネットのデータだったり、データが集まりやすいし
> さらにデータベース化されているケースが多い。
ぶっちゃけ無いよ。
データベースの用語風に言えば、今データベース化されてるのは
マスターデータ。機械学習で必要なのはトランザクションデータ
トランザクションデータはほとんどデータベース化されていない
せいぜい自社の過去のデータが、必要最小限だけ残ってる程度
大企業以外、統計的に役に立たない
(正確に言えば人間が予測した精度と大差ない)
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.049s