[過去ログ] 【統計分析】機械学習・データマイニング21 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
690: (ワッチョイ 95b3-rWdN) 2018/12/28(金)14:09 ID:KXx45DYL0(1) AAS
それは標準化の仕方が間違ってる
[-2, -1, 0, 1, 2]/√2
が正しいから大小関係は残る
691(1): (アウアウカー Sa4d-uRxS) 2018/12/28(金)15:15 ID:wGEI6iLia(1/2) AAS
>>687
よくある標準化は学習データを平均=0、分散=1にしてその時に使った係数を残しておいてテストデータにも適用する
分散を変える以上は差の絶対値が変わるのは仕方ないが同じ係数をテストデータに使うのが重要で、結局同じ比率で調整されるので問題はない
692(2): (ワッチョイ 7d98-4fyn) 2018/12/28(金)15:43 ID:Nt5XO8IQ0(6/19) AAS
>>680
> winnyは開発者が捕まるのがありえなかったよなー
winnyは開発者は、考え方が厨二だったからなぁ
この世界は腐っている。一度滅びなければいけない。
新世界を作るために、私は滅びの道具を作った。
だからな。
世界を良くする道具を作ればいいのに、
なぜか滅ぼす道具を作って「お前らあとは頑張れ」だもんなぁ。
あんなんだからWinnyは何も変えられなかった。
693(1): (ワッチョイ 7d98-4fyn) 2018/12/28(金)15:44 ID:Nt5XO8IQ0(7/19) AAS
厨二っていうかサイコパスかな
694: (ブーイモ MMa1-pOqM) 2018/12/28(金)16:06 ID:2zbjWBV3M(2/3) AAS
まともな用途向けだと流行らなかったりして
695: (ワッチョイ dad2-CP3A) 2018/12/28(金)17:31 ID:tfE2tijX0(1) AAS
生きてたら仮想通貨やってただろうな
まああれも結局マネロン用途だろうからまともではないか
696: (ブーイモ MMa1-pOqM) 2018/12/28(金)17:38 ID:2zbjWBV3M(3/3) AAS
ソフトイーサはいいところ攻めてるような。捕まらないような持って行き方は色々あったろうに
697: (ワッチョイ 7d98-4fyn) 2018/12/28(金)17:39 ID:Nt5XO8IQ0(8/19) AAS
ソフトイーサは単なるVPNじゃん。OpenVPNと変わらない
698(1): (ワッチョイ 6adc-AIgs) 2018/12/28(金)18:19 ID:+dm45OvN0(1) AAS
このブログの人の勤め先ってNTTデータとかCTC?
外部リンク:biz-and-deep.hatenablog.com
外資系じゃなそうだけど、
この頻度で新規AI案件を取ってきて回してる大企業って思い浮かばない
699: (ワッチョイ 2124-SF4R) 2018/12/28(金)18:29 ID:Wn6dMni60(4/10) AAS
>>698
NTTデータじゃないと思う。こんな下流は回らない
にしても日本はIT関連の営業レベルが低すぎる。
*やばいエンジニア
以下は本気でヤバイ
700(2): (アウアウイー Sa35-J3Xo) 2018/12/28(金)18:47 ID:3Bc3qTdBa(1/6) AAS
ここに書いてある中で、一つだけ賛成できないのは
データ(分析対象になるデータ)の件。
それこそ、生の形でデータを受取り分析者側で加工から
やることが私は必要だと思っている。
そもそも顧客のデータを信じるところから始めてはいけない。
今は、ネットのデータだったり、データが集まりやすいし
さらにデータベース化されているケースが多い。
それに甘んじたまま分析に入ろうとする人が多いのは
私は疑問。
701(2): (ワッチョイ 7d98-4fyn) 2018/12/28(金)19:07 ID:Nt5XO8IQ0(9/19) AAS
>>700
どれに対して言ってるのか知らないけど
機械学習はデータをコンピュータを使って高速に演算するものなんだから、
データが重要なのは当たり前だよ。
でも "機械学習" ではないけどね。俺が機械学習に興味が薄いのは
結局最後にはデータをどうするか?の話になってしまうのがわかってるから。
機械学習のアルゴリズムがーではなく、○○データを加えることで精度がー。とかいう流れになる
行き着く先は、データの売買ビジネスだよ。
今はデータが有るようで無いからね。
例えば売上データはあるが、あるのは売上データだけだ。コンビニとか
省7
702(1): (ワッチョイ 7d98-4fyn) 2018/12/28(金)19:13 ID:Nt5XO8IQ0(10/19) AAS
>>700
> 今は、ネットのデータだったり、データが集まりやすいし
> さらにデータベース化されているケースが多い。
ぶっちゃけ無いよ。
データベースの用語風に言えば、今データベース化されてるのは
マスターデータ。機械学習で必要なのはトランザクションデータ
トランザクションデータはほとんどデータベース化されていない
せいぜい自社の過去のデータが、必要最小限だけ残ってる程度
大企業以外、統計的に役に立たない
(正確に言えば人間が予測した精度と大差ない)
703(2): (ワッチョイ 2124-SF4R) 2018/12/28(金)19:17 ID:Wn6dMni60(5/10) AAS
>年齢層入力
元コンビニバイトだけど、忙しいと全部「10-20代」を叩くのが当たり前。タバコと酒でエラー出るからな
忙し店は若者向けで入力してる可能性が高い、というか当たり前
704: (アウアウイー Sa35-J3Xo) 2018/12/28(金)19:22 ID:3Bc3qTdBa(2/6) AAS
>>701
そういう話をしたわけじゃないんだよね。
残念ながらデータは足りなくてあたりまえだから。
705: (アウアウイー Sa35-J3Xo) 2018/12/28(金)19:24 ID:3Bc3qTdBa(3/6) AAS
>>703
そうですね。
その問題はもう25年前から出てきている話題
706(2): (ワッチョイ 7d98-4fyn) 2018/12/28(金)19:26 ID:Nt5XO8IQ0(11/19) AAS
>>703
そうそう。信用できる過去のデータは少ない。
そういう意味でも「今はデータが有るようで無い」
データが間違ってるんだから、そこから学習しても間違った答えになる
まあ結局は確率でしか答えが出ないんだから、
ある程度は正解するんだけどねw
で、精度をあげようとすると、データの質がーって話になって
正しいデータを入力するよう徹底してくださいとか、
修正できるなら修正してくださいとか(例えば明らかなタイポとかなら修正できる)
そういう話に行き着くので、つまらねぇなぁと
707: (アウアウイー Sa35-J3Xo) 2018/12/28(金)19:27 ID:3Bc3qTdBa(4/6) AAS
>>706
そうなんです。
それを知るためには、まず本当の生データを分析するところから
はじめないと、ならないんですよ。
708(1): (アウアウイー Sa35-J3Xo) 2018/12/28(金)19:31 ID:3Bc3qTdBa(5/6) AAS
>>702
>大企業以外、統計的に役に立たない
>(正確に言えば人間が予測した精度と大差ない)
それ自体の分析から始めないとあかんのよ
それを使えるようにしてゆくのが仕事
709: (ワッチョイ b68a-YRCv) 2018/12/28(金)19:37 ID:X6YBhkn90(1) AAS
機械学習の有用性はラプラスの悪魔がだけが知っている
上下前次1-新書関写板覧索設栞歴
あと 293 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.201s*