[過去ログ] 【統計分析】機械学習・データマイニング31 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
500: (アウアウウー Sa47-mHJH [106.154.70.188]) 2022/04/24(日)23:04 ID:b8mqC9pha(1) AAS
MLの定義なんて決まってないからな
入れる奴もいれば入れない奴もいるってだけ
俺は最小二乗法も入ると考えてるけど、内心では古典的なクラスタリング含めてそんなもんML扱いすんなよと思ってる
501: (ワッチョイ 7701-/zPW [126.125.20.44]) 2022/04/25(月)08:28 ID:WWt+XW3b0(1) AAS
こんなこと言っても線形回帰に精度で負けちゃうんだよね
502: (ワンミングク MM97-7xH5 [114.156.59.119]) 2022/04/25(月)17:57 ID:W8GcUQ3oM(1) AAS
成田悠輔ってどうよ?
503: (ワッチョイ ab63-UtWS [180.22.54.207]) 2022/04/26(火)01:25 ID:Kn8thUra0(1) AAS
回帰の勾配ブースティング木の勾配がMSEの微分で残差となるのは理解できたのですが、
分類問題の場合の各決定木の勾配って何になるのでしょうか?
504: (ワッチョイ db6e-7xH5 [138.64.67.32]) 2022/04/26(火)06:10 ID:+JXXpgOw0(1) AAS
mse
505: (ワンミングク MM4f-7xH5 [60.45.221.227]) 2022/04/27(水)14:32 ID:iTC4QIl5M(1) AAS
lecunとbengioとhintonは普通の研究者のひとつ上のレベルにいるのな
大体の技術の先駆者で驚愕
最近のlecunのインタビュー読んだけどまだアイデアがあるみたいだな
arcfaceでひーこら言ってる俺とは違いすぎて挫折感ハンパない
506: (ワッチョイ 8b5f-/zPW [14.12.4.1]) 2022/04/28(木)01:23 ID:jP1CmVa/0(1/2) AAS
割と微妙かな。いうほどクリティカルな論文は出してないんじゃ。
507: (ワンミングク MM4f-7xH5 [60.45.221.227]) 2022/04/28(木)13:28 ID:oc5VTTvkM(1) AAS
東大がディープフェイク検出アルゴリズムを出したみたい
508: (アウアウウー Sa47-mHJH [106.154.70.243]) 2022/04/28(木)13:39 ID:moo4Gf/Ba(1) AAS
まばたきしないとか髪ぼやけるとか、人間なら検出できるって言ってたからな
そのうちディープフェイク側が精度上がるだろ
509: (ワッチョイ 8b5f-MOU1 [14.12.4.1]) 2022/04/28(木)14:29 ID:jP1CmVa/0(2/2) AAS
てかそうやって進歩させるのがGANのコンセプトではあるわな。
510: (ワッチョイ db6e-7xH5 [138.64.67.32]) 2022/04/28(木)20:37 ID:bi7reEEy0(1) AAS
違う
511: (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)06:55 ID:u2uFhB8a0(1/6) AAS
Qiita のこの記事、実にいいなぁ
機械学習でなんとかしようと安易に考えるな
外部リンク:qiita.com
ディープラーニングなら学習すればできるんでしょ、と言う奴、どっか遠くの星にでもに行ってほしい
512(1): (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)07:29 ID:u2uFhB8a0(2/6) AAS
たとえば、お客さんが受け取った帳票が領収書か請求書かを自動判別したい場合、
今まで受け取った領収書と請求書の画像を学習データにしてDLに学習させて、できた簡単とか言う奴いるけど
・未知の帳票フォーマットに対して有効なのかそれ?
・受け取った帳票は全部印字・記入済なんだが、そんなんで学習していいのか?(未記入帳票は不要なの?)
そんなんには怖くってまかせられないんだが、おいらの感覚は合ってるよね
513(1): (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)07:52 ID:u2uFhB8a0(3/6) AAS
たとえば文字枠のある用紙に書かれた手書き文字を OCR する場合
・手書き文字だから枠からはみ出すし、はみ出す位置もさまざまだし、
・文字枠も1桁ごとだったり3桁ごとだったり点線だったりキリがない
こういうのは対象画像をそのまま(枠付きで)DLに学習させても、読めますよなんてとても言えんと思うんだが。最近はそうでもないのか?
昔は専門家がデータ眺めてうんうん唸ってロジックを考えていたが、そういうのも大切だよねと
514(1): (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)08:12 ID:u2uFhB8a0(4/6) AAS
あと、学習データで評価してお客に報告するアホ技術者?もシリウスβあたりに左遷して欲しい
スキャンしなおしたら同じ紙でも別データだよね、とかいうやつも
正読率80%はぎりぎり最低ラインで、どんな方法を使ってもこの程度はいきます
95%を超えるあたりからが勝負です。頑張りましょうね。と言いたい
515: (ワッチョイ 9d6e-xesJ [138.64.67.32]) 2022/05/07(土)12:37 ID:Gp5QHcLl0(1) AAS
simclrはしんくらーで良いの?
516(1): (ワッチョイ 6204-cfd4 [131.213.243.150]) 2022/05/07(土)13:07 ID:TDwBHkCb0(1/4) AAS
>>512-514
基本的に事前に確認しておく内容かと
後から言われても対処できんよ
517: (ワッチョイ 8d7c-TPhO [122.218.227.106]) 2022/05/07(土)13:59 ID:u2uFhB8a0(5/6) AAS
>>516
誰が何を確認するの?
学習データとして妥当なのかそれ、という話なんだが
518(1): (ワッチョイ 6204-cfd4 [131.213.243.150]) 2022/05/07(土)14:17 ID:TDwBHkCb0(2/4) AAS
学習データの妥当性や追加のデータが必要かどうかも普通は打ち合わせしとくよね?
最終的なアウトプットを出す為に必要なデータもエンジニアから提案あるよね?
519: (ワッチョイ 0202-zDU0 [59.138.123.33]) 2022/05/07(土)14:31 ID:9e79BjZl0(1) AAS
学習データが1000万件ぐらいあれば話が変わってくるけど
現実にあるのはせいぜい1万件、ひどいと100件ぐらいで
何とかしてくれと言ってくる
520: (ワッチョイ 6204-cfd4 [131.213.243.150]) 2022/05/07(土)14:35 ID:TDwBHkCb0(3/4) AAS
無茶なこと言ってくる人多いからね
最初にはっきりさせておかないと後々面倒になるんだよ
今は周りも大分理解が進んできてるけどさ
521: (アウアウウー Sac5-e+q+ [106.154.64.98]) 2022/05/07(土)14:51 ID:cvuJwPv2a(1) AAS
「100件でやれ」といわれて「それじゃ少なすぎてできない」というのは簡単だけど
本当にできないとは限らないからな
そこが難しいところなんだよ
「やる気になれない」とか「俺には無理」ってだけ
522: (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)15:00 ID:u2uFhB8a0(6/6) AAS
>>518
学習データの妥当性って基本的にベンダー側が確認するもんだよね?
お客さん的には、領収書と請求書が見分けられる提案が貰えれば、他はどうでもいい。
ベンダー側の危機感知能力に依存するんじゃないだろうか。
しくじると悲惨。しかも試験運用では完璧だったりする。
523: (ワッチョイ 6204-cfd4 [131.213.243.150]) 2022/05/07(土)15:02 ID:TDwBHkCb0(4/4) AAS
自分の研究開発テーマだったら取り組む
他部門からの依頼だと確証が持てないから断るかな
524(2): (JP 0Hca-dy93 [103.163.220.76]) 2022/05/09(月)20:40 ID:nBUQfFjcH(1) AAS
初心者の質問ですみません
学習中にバッチサイズを変更すると、lossとaccuracyが変わってしまうんですが、
バッチサイズによって収束値が変わるってことでしょうか?
それだとバッチサイズの設定が結果の精度に影響しませんか?
525(1): (ワッチョイ ee10-UDwQ [153.243.43.6]) 2022/05/10(火)08:13 ID:/XkHfgKF0(1/3) AAS
>>524
影響するよー。だからハイパーパラメータの調整はバッチサイズも含むんだよー。ミニバッチが内部的に何やってるかはググってね。でも、ざっくり、学習パラメータ最適化時のサンプリングサイズだと思えばいいよー
526(1): (JP 0Hca-tbBW [103.163.220.100]) 2022/05/10(火)08:51 ID:NCnPeIRkH(1) AAS
>>525
ありがとうございます
やっぱり影響するんですね
そうなると、モデルの作り方、パラメータの設定方法、必ず正しいというやり方がないので、
初心者にはハードルが高いですね
もうある程度適当にエイヤーでやってみるしかないですね
527(1): (ワッチョイ ee10-cfd4 [153.243.43.6]) 2022/05/10(火)08:59 ID:/XkHfgKF0(2/3) AAS
>>526
正しいやり方はないけど、単純なアルゴリズムでベースラインモデル作って評価基準を作り、独自のモデルがそれと比較して優位かを確認しながら進めるという、方法論のテンプレはあるよー。
今ならAutoMLを使うのもいいねー。対応しているタスクならだけどねー
528: (JP 0Hca-wvgW [103.163.220.95]) 2022/05/10(火)09:43 ID:Kl+PeJSAH(1) AAS
>>527
AutoML、初めて知りました
無知でもできそうですねw
試しに入れてみました
いろいろ勉強できそうです
教えてくださりありがとうございました
529: (JP 0Hca-IBC7 [103.163.220.59]) 2022/05/10(火)11:29 ID:a3woWy82H(1) AAS
tpot自動すぎて怖いwww
エポック数すら指定しないし
追加学習したほうがよさそうなのにこれ以上は過学習になるんだろうか
上下前次1-新書関写板覧索設栞歴
あと 473 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.015s