[過去ログ]
【統計分析】機械学習・データマイニング24 (1002レス)
【統計分析】機械学習・データマイニング24 http://mevius.5ch.net/test/read.cgi/tech/1556674785/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
478: デフォルトの名無しさん (ワッチョイ 39ad-LXSb [124.144.197.178]) [] 2019/05/25(土) 10:07:48.15 ID:c7a1xFWv0 >>431 > どうやって仕事とってるの? どんな感じの内容? 「フリー」と書きましたけど、自営業というより「非正規」という意味で書きました。 元々統計学を専攻してたけど卒業してからIT企業にてSEやってました。 その会社でいろいろイヤなことがあって辞めて、 メーカー系列のPG作成のアルバイト募集で面接にいったとき、 統計学を専攻していたと言ったら ちょうどデータ分析の人を探しているということで アルバイトしませ
んか?といわれたのがはじまりです。 その後は、請負い、契約社員、SES契約、派遣社員と いろいろな契約形態でやっていましたけど、 そろそろ正社員になるかもしれません。 正社員になると年収は少し下がりますけど、 もうすぐ不況になりそうな予感がするので、 さっさと正社員になったほうがいいと思っています。 http://mevius.5ch.net/test/read.cgi/tech/1556674785/478
479: デフォルトの名無しさん (アウアウウー Sa3d-MHYn [106.180.24.132]) [sage] 2019/05/25(土) 10:55:38.38 ID:HkxaNc28a 教師あり学習って教師なしに誤差ゼロの特徴量が加わっただけだから大した差はないのになぜか別物扱いしてしまう人が多いよね http://mevius.5ch.net/test/read.cgi/tech/1556674785/479
480: デフォルトの名無しさん (ワッチョイ b190-9b2Z [112.138.212.35]) [sage] 2019/05/25(土) 11:19:48.34 ID:yOpOJb7D0 伝統的に別として説明する教科書が多いからだよ http://mevius.5ch.net/test/read.cgi/tech/1556674785/480
481: デフォルトの名無しさん (ワッチョイ fbab-DMSQ [39.111.85.105]) [sage] 2019/05/25(土) 11:24:42.57 ID:dxGKXP5f0 フリーで月200万もらえてたとかじゃなさそうね。 http://mevius.5ch.net/test/read.cgi/tech/1556674785/481
482: デフォルトの名無しさん (アウアウウー Sa3d-sFDG [106.180.15.171]) [] 2019/05/25(土) 12:14:49.26 ID:FHjbLbB2a >>479 誤差ゼロって何に対する誤差だよ ラベルの事を指してるんだろうがラベルは予測に使わないし特徴量ではない 教師ありとなしは完全に別物だぞ http://mevius.5ch.net/test/read.cgi/tech/1556674785/482
483: デフォルトの名無しさん (アウアウウー Sa3d-GYMe [106.180.2.26]) [sage] 2019/05/25(土) 12:28:42.88 ID:95Ybe8BPa ラベル以外の特徴量から何らかの方法でラベルに近そうなものを計算して、その計算結果と実際のラベルを比較して誤差を調べる 誤差が大きければ計算方法を修正する そうして最適なラベルの算出方法を決定するわけで、「予測に使う」というのが学習過程で使われるという意味ならラベルもその他の特徴量もしっかり予測に使われている 教師ありではラベルは絶対的に正しいこと(=誤差ゼロ)を前提とするのでラベルとの誤差が精度の良い評価
対象になるが、 教師なしでは誤差混じりの特徴量しか得られなかったがために別の評価指標を使っているだけのこと 理論の上では本質的な違いはないんだよ http://mevius.5ch.net/test/read.cgi/tech/1556674785/483
484: デフォルトの名無しさん (ワッチョイ fb66-h/tS [183.77.216.198]) [sage] 2019/05/25(土) 12:49:19.46 ID:uqI/ytR10 損失、じゃなくて? 誤差なの? http://mevius.5ch.net/test/read.cgi/tech/1556674785/484
485: デフォルトの名無しさん (オッペケ Sre5-sFDG [126.208.164.185]) [] 2019/05/25(土) 12:55:03.49 ID:9EmqmScDr >>483 学習途中の話?予測に使うというのはモデルに入力するという意味 運用時にラベルは与えられないだろ? 教師なしは学習時と運用時で使える情報は同じだが教師ありは違う 自動車と金槌の本質的な違いは?って聞かれても答えに困るわ 逆に理論のどこを見て本質的に同じだと思うのか 用語の意味を都合よく解釈しているようにしか思えない http://mevius.5ch.net/test/read.cgi/tech/1556674785/485
486: デフォルトの名無しさん (オッペケ Sre5-sFDG [126.208.164.185]) [] 2019/05/25(土) 13:04:20.15 ID:9EmqmScDr >>484 誤差の大小と損失の大小は同じなのでここではどちらでも良い http://mevius.5ch.net/test/read.cgi/tech/1556674785/486
487: デフォルトの名無しさん (ササクッテロ Spe5-rj+B [126.33.224.211]) [sage] 2019/05/25(土) 13:07:36.46 ID:t7lA5k1Lp >>483 前から教師ありとなしの本質的な差がないと主張する人がいて、その真意を聞きたかった 例えばMNISTで教師なしで分類したとする 全部で10種類とクラスの数を固定すれば、教師なしでもおそらく正しく分類してもらえ、本質的な差がないという主張は理解できる ではクラスの数が不明としたらどうだろう?教師なしではどんなにデータを増やしてもクラスの数が不明な限り同じ結果は得られないだろう この辺りの説明をしな
いで本質的に同じと説明すると、機械学習は本質的には最小二乗法と同じと言ってしまい炎上したのと同じ危うさがある http://mevius.5ch.net/test/read.cgi/tech/1556674785/487
488: デフォルトの名無しさん (スップ Sd73-tXlI [1.66.103.210]) [sage] 2019/05/25(土) 13:53:46.85 ID:S47qxAlEd 元々数学的な手法がいろいろあって、機械学習の分野のやつが勝手に2つに分類しただけ。 教師有りと無しで基礎原理は大きく異なる。 http://mevius.5ch.net/test/read.cgi/tech/1556674785/488
489: デフォルトの名無しさん (ワッチョイ 139c-mt45 [61.125.210.189]) [sage] 2019/05/25(土) 14:05:38.03 ID:O1zpSt3I0 まあ何らかのモデルの式のパラメーターを最大/最小にする問題と考えると大差はないかもしれん 正解ラベルとの誤差で式を立てるかそれ以外の式で立てるかどうかの違いでしかない 数学的に考えれば http://mevius.5ch.net/test/read.cgi/tech/1556674785/489
490: デフォルトの名無しさん (スップ Sd73-tXlI [1.66.103.210]) [sage] 2019/05/25(土) 14:07:27.49 ID:S47qxAlEd ??? http://mevius.5ch.net/test/read.cgi/tech/1556674785/490
491: デフォルトの名無しさん (スップ Sd73-tXlI [1.66.103.210]) [sage] 2019/05/25(土) 14:07:51.79 ID:S47qxAlEd >>489 原理わかってないの? http://mevius.5ch.net/test/read.cgi/tech/1556674785/491
492: デフォルトの名無しさん (スップ Sd73-tXlI [1.66.103.210]) [sage] 2019/05/25(土) 14:09:45.78 ID:S47qxAlEd 489の条件は絶対的でないよ http://mevius.5ch.net/test/read.cgi/tech/1556674785/492
493: デフォルトの名無しさん (ワンミングク MMd3-M5Km [153.235.70.219]) [] 2019/05/25(土) 14:23:18.41 ID:rW5FDb6DM ディープラーニング使ったらCGとかも今よりずっと低コストで作れるんだろうな 個人でスターウォーズなみの映画とか作れたりとか 特に流体の表現でかなり効果を発揮しそう http://mevius.5ch.net/test/read.cgi/tech/1556674785/493
494: デフォルトの名無しさん (アウアウウー Sa3d-j5mF [106.129.138.200]) [sage] 2019/05/25(土) 15:42:51.81 ID:/Qx1Z2J/a 3水準以上の多重比較検定は偶然の確率が上がるから棄却域を下げるっていうのが納得いかないんだけど ABCの3水準があってAとBに差があるかだけが知りたい場合Cとの検定は関係ないのでは?(極論を言えばCとの検定を行わない) どこかに差があるかを調べたい場合のみ有意水準を操作すればいいの? http://mevius.5ch.net/test/read.cgi/tech/1556674785/494
495: デフォルトの名無しさん (アウアウウー Sa3d-sFDG [106.180.11.32]) [] 2019/05/25(土) 15:49:22.03 ID:LV9LUlXva >>489 そうだな、犬も猫も人間も哺乳類と考えると大差はないかもしれん http://mevius.5ch.net/test/read.cgi/tech/1556674785/495
496: デフォルトの名無しさん (エムゾネ FF33-wLN0 [49.106.193.230]) [] 2019/05/25(土) 16:19:05.08 ID:997oQV33F データサイエンティスト育成講座 https://www.hanmoto.com/bd/isbn/9784839965259 http://mevius.5ch.net/test/read.cgi/tech/1556674785/496
497: デフォルトの名無しさん (エムゾネ FF33-wLN0 [49.106.193.230]) [] 2019/05/25(土) 16:40:11.40 ID:997oQV33F ・手取り足取りデータの前処理から予測モデルの作成、チューニングまで一通り網羅 ・質の良い参考書がたくさん紹介されており、これから先もある程度示してくれる ・学術書でないので、安い 欠点: いずれも入門書である以上当たり前ですが ・アルゴリズムの数学的なところはすっとばし ・実務の前処理地獄はこんなもんじゃない ・この本の内容ができる程度で「AI人材」を名乗るな http://mevius.5ch.net/test/read.cgi/tech/155667478
5/497
498: デフォルトの名無しさん (ワッチョイ fb66-h/tS [183.77.216.198]) [] 2019/05/25(土) 16:42:30.74 ID:uqI/ytR10 まず松尾豊の研究室から 論文とデータサイエンティストが生まれてから 本を出せや http://mevius.5ch.net/test/read.cgi/tech/1556674785/498
499: デフォルトの名無しさん (エムゾネ FF33-wLN0 [49.106.193.230]) [] 2019/05/25(土) 16:45:51.62 ID:997oQV33F 執筆者ではない 監修ですらない http://mevius.5ch.net/test/read.cgi/tech/1556674785/499
500: デフォルトの名無しさん (ワッチョイ a109-tXlI [210.170.17.6]) [sage] 2019/05/25(土) 17:10:51.99 ID:UpoKtTek0 現在、AI事業が流行ってるわけではなく、AI事業を育成するための事業が流行中。 実績?わらわら。 http://mevius.5ch.net/test/read.cgi/tech/1556674785/500
501: デフォルトの名無しさん (アークセー Sxe5-wJnf [126.196.33.29]) [sage] 2019/05/25(土) 17:21:31.34 ID:MDBcKokxx >>494 若干スレ違いとも思うけど検定の多重性問題だね ロジカルに考えると分かると思うよ 例えば3学級A, B, Cの算数の試験で、学級Cは他学級よりも優秀か調べたい つまり (C > A) AND (C > B) を調べたい 検定としては(A = C) OR (B = C)を帰無仮説としてこれを棄却したい 棄却域をそれぞれ5%とすると、5%の可能性で(A = C)がFalse, (B = C)がFalseとなる (A = C)と(B = C)の両方がFalseにならない限り、(A = C) OR (B
= C)はFalseにならない この場合はA = Cを帰無仮説とした検定とB = Cを帰無仮説とした検定の2つを行って良い 別のケースで、学級Aあるいは学級Bが学級Cよりも優秀か調べたい場合を考える つまり (A > C) OR (B > C) を調べたい 検定としては(A = C) AND (B = C)を棄却したい 上記同様に棄却域をそれぞれ5%とすると、5%の可能性で(A = C)がFalse, (B = C)がFalseとなる (A = C)と(B = C)のどちらかがFalseになると(A = C) AND (B = C)はFalseになってしまう つまり棄却されやすくなってしまっているので有意水準を調整する必要がある http://me
vius.5ch.net/test/read.cgi/tech/1556674785/501
502: デフォルトの名無しさん (トンモー MM2d-naOy [210.142.95.180]) [] 2019/05/25(土) 17:36:49.30 ID:suGe7WeyM >>493 どゆふうに流体と関係あんの? http://mevius.5ch.net/test/read.cgi/tech/1556674785/502
503: デフォルトの名無しさん (ワッチョイ 09b0-YgKV [180.15.171.212]) [sage] 2019/05/25(土) 18:13:45.67 ID:BEAwB+2w0 >>496 この本見たけど初心者には訳わからんし上級者には役に立たなさそうで何とも惜しい感じがした http://mevius.5ch.net/test/read.cgi/tech/1556674785/503
504: デフォルトの名無しさん (ワッチョイ f33e-M5Km [149.54.201.210]) [] 2019/05/25(土) 18:20:19.51 ID:69q3ULG00 >>502 流体の境界条件・初期条件に対する流体の解析処理結果を学習データとして使用すれば、それをもとに自動的に流体のアニメーションを生成してくれるものができるはずって意味です 今までの流体解析はスーパーコンピュータ使ったりしてすごくコスト高かったけどAI使えば低スペックPCでもよりリアルな流体表現ができるよねって話 http://mevius.5ch.net/test/read.cgi/tech/1556674785/504
505: デフォルトの名無しさん (アウアウウー Sa3d-j5mF [106.129.83.38]) [sage] 2019/05/25(土) 19:52:31.11 ID:C+z4Q3r1a >>501 出したい結論次第ということか あと質問なんだけど、 前者の帰無仮説の(A=C)と(B=C)をそれぞれ棄却域5%で検定したら 全体では棄却域1-(1-0.05)*(1-0.05)=9.75%で検定したことになりませんか? http://mevius.5ch.net/test/read.cgi/tech/1556674785/505
506: デフォルトの名無しさん (アークセー Sxe5-wJnf [126.196.33.29]) [sage] 2019/05/25(土) 21:18:20.43 ID:MDBcKokxx >>505 前者は(A=C)の検定と(B=C)の検定を合わせて全体でという考え方はしない 帰無仮説の説明からしたほうが良さそう 「Aの平均とBの平均は異なる」を検証するのに、わざわざ帰無仮説として 「Aの平均とBの平均は同じである(A = B)」という仮説をするのか? それは「同じである」ことはケースとして1ケースしかないが 同じでないことはケースが無限に存在し検証ができない 「平均が同じ」という仮説を立てることで、現在発生
している状況が どのくらい起こりにくいことなのかを計算することができる 後者の(A = B) AND (B = C)は書き直せばA = B = Cで これはケースとしては1ケースしかないので帰無仮説として利用可能である しかし前者の(A = B) OR (B = C)は、片方を満たせばもう片方は無限のケースを許してしまい これは帰無仮説として設定しても計算できない 大元の質問に戻って、ABCの3水準がある場合にCの検定をする必要がないのでは? という質問については、帰無仮説として「A=B=C」が設定できないのであれば 当然多重比較検定の前提条件を満たしていない http://
mevius.5ch.net/test/read.cgi/tech/1556674785/506
507: デフォルトの名無しさん (ワッチョイ b190-9b2Z [112.138.212.35]) [sage] 2019/05/25(土) 21:54:09.32 ID:yOpOJb7D0 >今までの流体解析はスーパーコンピュータ使ったりしてすごくコスト高かったけどAI使えば低スペックPCでもよりリアルな流体表現ができるよねって話 ありえねーわ。 微分方程式の数値解求めるアルゴリズムと 補間曲線フィッティングするアルゴリズムは目的も用途も別。 ちなみにCAEとAIは相性自体は良い。 CAEはデータを無限に生成できるからな。 昔からアンテナシミュレーションソフトに最適化っていう機能あって 古
い機械学習アルゴリズムがついていたりした。 http://mevius.5ch.net/test/read.cgi/tech/1556674785/507
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 495 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.014s