[過去ログ] 【統計分析】機械学習・データマイニング24 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
479(1): (アウアウウー Sa3d-MHYn [106.180.24.132]) 2019/05/25(土)10:55 ID:HkxaNc28a(1) AAS
教師あり学習って教師なしに誤差ゼロの特徴量が加わっただけだから大した差はないのになぜか別物扱いしてしまう人が多いよね
480: (ワッチョイ b190-9b2Z [112.138.212.35]) 2019/05/25(土)11:19 ID:yOpOJb7D0(1/2) AAS
伝統的に別として説明する教科書が多いからだよ
481: (ワッチョイ fbab-DMSQ [39.111.85.105]) 2019/05/25(土)11:24 ID:dxGKXP5f0(1) AAS
フリーで月200万もらえてたとかじゃなさそうね。
482: (アウアウウー Sa3d-sFDG [106.180.15.171]) 2019/05/25(土)12:14 ID:FHjbLbB2a(1) AAS
>>479
誤差ゼロって何に対する誤差だよ
ラベルの事を指してるんだろうがラベルは予測に使わないし特徴量ではない
教師ありとなしは完全に別物だぞ
483(2): (アウアウウー Sa3d-GYMe [106.180.2.26]) 2019/05/25(土)12:28 ID:95Ybe8BPa(1) AAS
ラベル以外の特徴量から何らかの方法でラベルに近そうなものを計算して、その計算結果と実際のラベルを比較して誤差を調べる
誤差が大きければ計算方法を修正する
そうして最適なラベルの算出方法を決定するわけで、「予測に使う」というのが学習過程で使われるという意味ならラベルもその他の特徴量もしっかり予測に使われている
教師ありではラベルは絶対的に正しいこと(=誤差ゼロ)を前提とするのでラベルとの誤差が精度の良い評価対象になるが、
教師なしでは誤差混じりの特徴量しか得られなかったがために別の評価指標を使っているだけのこと
理論の上では本質的な違いはないんだよ
484(1): (ワッチョイ fb66-h/tS [183.77.216.198]) 2019/05/25(土)12:49 ID:uqI/ytR10(3/4) AAS
損失、じゃなくて?
誤差なの?
485: (オッペケ Sre5-sFDG [126.208.164.185]) 2019/05/25(土)12:55 ID:9EmqmScDr(1/2) AAS
>>483
学習途中の話?予測に使うというのはモデルに入力するという意味
運用時にラベルは与えられないだろ?
教師なしは学習時と運用時で使える情報は同じだが教師ありは違う
自動車と金槌の本質的な違いは?って聞かれても答えに困るわ
逆に理論のどこを見て本質的に同じだと思うのか
用語の意味を都合よく解釈しているようにしか思えない
486: (オッペケ Sre5-sFDG [126.208.164.185]) 2019/05/25(土)13:04 ID:9EmqmScDr(2/2) AAS
>>484
誤差の大小と損失の大小は同じなのでここではどちらでも良い
487: (ササクッテロ Spe5-rj+B [126.33.224.211]) 2019/05/25(土)13:07 ID:t7lA5k1Lp(1) AAS
>>483
前から教師ありとなしの本質的な差がないと主張する人がいて、その真意を聞きたかった
例えばMNISTで教師なしで分類したとする
全部で10種類とクラスの数を固定すれば、教師なしでもおそらく正しく分類してもらえ、本質的な差がないという主張は理解できる
ではクラスの数が不明としたらどうだろう?教師なしではどんなにデータを増やしてもクラスの数が不明な限り同じ結果は得られないだろう
この辺りの説明をしないで本質的に同じと説明すると、機械学習は本質的には最小二乗法と同じと言ってしまい炎上したのと同じ危うさがある
488: (スップ Sd73-tXlI [1.66.103.210]) 2019/05/25(土)13:53 ID:S47qxAlEd(1/4) AAS
元々数学的な手法がいろいろあって、機械学習の分野のやつが勝手に2つに分類しただけ。
教師有りと無しで基礎原理は大きく異なる。
489(2): (ワッチョイ 139c-mt45 [61.125.210.189]) 2019/05/25(土)14:05 ID:O1zpSt3I0(1) AAS
まあ何らかのモデルの式のパラメーターを最大/最小にする問題と考えると大差はないかもしれん
正解ラベルとの誤差で式を立てるかそれ以外の式で立てるかどうかの違いでしかない
数学的に考えれば
490: (スップ Sd73-tXlI [1.66.103.210]) 2019/05/25(土)14:07 ID:S47qxAlEd(2/4) AAS
???
491: (スップ Sd73-tXlI [1.66.103.210]) 2019/05/25(土)14:07 ID:S47qxAlEd(3/4) AAS
>>489
原理わかってないの?
492: (スップ Sd73-tXlI [1.66.103.210]) 2019/05/25(土)14:09 ID:S47qxAlEd(4/4) AAS
489の条件は絶対的でないよ
493(1): (ワンミングク MMd3-M5Km [153.235.70.219]) 2019/05/25(土)14:23 ID:rW5FDb6DM(1) AAS
ディープラーニング使ったらCGとかも今よりずっと低コストで作れるんだろうな
個人でスターウォーズなみの映画とか作れたりとか
特に流体の表現でかなり効果を発揮しそう
494(1): (アウアウウー Sa3d-j5mF [106.129.138.200]) 2019/05/25(土)15:42 ID:/Qx1Z2J/a(1) AAS
3水準以上の多重比較検定は偶然の確率が上がるから棄却域を下げるっていうのが納得いかないんだけど
ABCの3水準があってAとBに差があるかだけが知りたい場合Cとの検定は関係ないのでは?(極論を言えばCとの検定を行わない)
どこかに差があるかを調べたい場合のみ有意水準を操作すればいいの?
495: (アウアウウー Sa3d-sFDG [106.180.11.32]) 2019/05/25(土)15:49 ID:LV9LUlXva(1) AAS
>>489
そうだな、犬も猫も人間も哺乳類と考えると大差はないかもしれん
496(1): (エムゾネ FF33-wLN0 [49.106.193.230]) 2019/05/25(土)16:19 ID:997oQV33F(1/3) AAS
データサイエンティスト育成講座
外部リンク:www.hanmoto.com
497: (エムゾネ FF33-wLN0 [49.106.193.230]) 2019/05/25(土)16:40 ID:997oQV33F(2/3) AAS
・手取り足取りデータの前処理から予測モデルの作成、チューニングまで一通り網羅
・質の良い参考書がたくさん紹介されており、これから先もある程度示してくれる
・学術書でないので、安い
欠点: いずれも入門書である以上当たり前ですが
・アルゴリズムの数学的なところはすっとばし
・実務の前処理地獄はこんなもんじゃない
・この本の内容ができる程度で「AI人材」を名乗るな
498: (ワッチョイ fb66-h/tS [183.77.216.198]) 2019/05/25(土)16:42 ID:uqI/ytR10(4/4) AAS
まず松尾豊の研究室から
論文とデータサイエンティストが生まれてから
本を出せや
499: (エムゾネ FF33-wLN0 [49.106.193.230]) 2019/05/25(土)16:45 ID:997oQV33F(3/3) AAS
執筆者ではない
監修ですらない
500: (ワッチョイ a109-tXlI [210.170.17.6]) 2019/05/25(土)17:10 ID:UpoKtTek0(1) AAS
現在、AI事業が流行ってるわけではなく、AI事業を育成するための事業が流行中。
実績?わらわら。
501(1): (アークセー Sxe5-wJnf [126.196.33.29]) 2019/05/25(土)17:21 ID:MDBcKokxx(1/2) AAS
>>494
若干スレ違いとも思うけど検定の多重性問題だね
ロジカルに考えると分かると思うよ
例えば3学級A, B, Cの算数の試験で、学級Cは他学級よりも優秀か調べたい
つまり (C > A) AND (C > B) を調べたい
検定としては(A = C) OR (B = C)を帰無仮説としてこれを棄却したい
棄却域をそれぞれ5%とすると、5%の可能性で(A = C)がFalse, (B = C)がFalseとなる
(A = C)と(B = C)の両方がFalseにならない限り、(A = C) OR (B = C)はFalseにならない
この場合はA = Cを帰無仮説とした検定とB = Cを帰無仮説とした検定の2つを行って良い
別のケースで、学級Aあるいは学級Bが学級Cよりも優秀か調べたい場合を考える
つまり (A > C) OR (B > C) を調べたい
検定としては(A = C) AND (B = C)を棄却したい
上記同様に棄却域をそれぞれ5%とすると、5%の可能性で(A = C)がFalse, (B = C)がFalseとなる
(A = C)と(B = C)のどちらかがFalseになると(A = C) AND (B = C)はFalseになってしまう
つまり棄却されやすくなってしまっているので有意水準を調整する必要がある
502(1): (トンモー MM2d-naOy [210.142.95.180]) 2019/05/25(土)17:36 ID:suGe7WeyM(1) AAS
>>493
どゆふうに流体と関係あんの?
503: (ワッチョイ 09b0-YgKV [180.15.171.212]) 2019/05/25(土)18:13 ID:BEAwB+2w0(1) AAS
>>496
この本見たけど初心者には訳わからんし上級者には役に立たなさそうで何とも惜しい感じがした
504: (ワッチョイ f33e-M5Km [149.54.201.210]) 2019/05/25(土)18:20 ID:69q3ULG00(1) AAS
>>502
流体の境界条件・初期条件に対する流体の解析処理結果を学習データとして使用すれば、それをもとに自動的に流体のアニメーションを生成してくれるものができるはずって意味です
今までの流体解析はスーパーコンピュータ使ったりしてすごくコスト高かったけどAI使えば低スペックPCでもよりリアルな流体表現ができるよねって話
505(1): (アウアウウー Sa3d-j5mF [106.129.83.38]) 2019/05/25(土)19:52 ID:C+z4Q3r1a(1) AAS
>>501
出したい結論次第ということか
あと質問なんだけど、
前者の帰無仮説の(A=C)と(B=C)をそれぞれ棄却域5%で検定したら
全体では棄却域1-(1-0.05)*(1-0.05)=9.75%で検定したことになりませんか?
506(1): (アークセー Sxe5-wJnf [126.196.33.29]) 2019/05/25(土)21:18 ID:MDBcKokxx(2/2) AAS
>>505
前者は(A=C)の検定と(B=C)の検定を合わせて全体でという考え方はしない
帰無仮説の説明からしたほうが良さそう
「Aの平均とBの平均は異なる」を検証するのに、わざわざ帰無仮説として
「Aの平均とBの平均は同じである(A = B)」という仮説をするのか?
それは「同じである」ことはケースとして1ケースしかないが
同じでないことはケースが無限に存在し検証ができない
「平均が同じ」という仮説を立てることで、現在発生している状況が
どのくらい起こりにくいことなのかを計算することができる
後者の(A = B) AND (B = C)は書き直せばA = B = Cで
これはケースとしては1ケースしかないので帰無仮説として利用可能である
しかし前者の(A = B) OR (B = C)は、片方を満たせばもう片方は無限のケースを許してしまい
これは帰無仮説として設定しても計算できない
大元の質問に戻って、ABCの3水準がある場合にCの検定をする必要がないのでは?
という質問については、帰無仮説として「A=B=C」が設定できないのであれば
当然多重比較検定の前提条件を満たしていない
507(1): (ワッチョイ b190-9b2Z [112.138.212.35]) 2019/05/25(土)21:54 ID:yOpOJb7D0(2/2) AAS
>今までの流体解析はスーパーコンピュータ使ったりしてすごくコスト高かったけどAI使えば低スペックPCでもよりリアルな流体表現ができるよねって話
ありえねーわ。
微分方程式の数値解求めるアルゴリズムと
補間曲線フィッティングするアルゴリズムは目的も用途も別。
ちなみにCAEとAIは相性自体は良い。
CAEはデータを無限に生成できるからな。
昔からアンテナシミュレーションソフトに最適化っていう機能あって
古い機械学習アルゴリズムがついていたりした。
508: (ワッチョイ 535c-j5mF [115.36.224.159]) 2019/05/25(土)22:17 ID:j+1UCpGZ0(1) AAS
>>506
同時にfalse positiveが発生しない限り間違って棄却されないから問題ないってことか
上下前次1-新書関写板覧索設栞歴
あと 494 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.013s