[過去ログ] 【統計分析】機械学習・データマイニング31 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
511: (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)06:55 ID:u2uFhB8a0(1/6) AAS
Qiita のこの記事、実にいいなぁ

機械学習でなんとかしようと安易に考えるな
外部リンク:qiita.com

ディープラーニングなら学習すればできるんでしょ、と言う奴、どっか遠くの星にでもに行ってほしい
512
(1): (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)07:29 ID:u2uFhB8a0(2/6) AAS
たとえば、お客さんが受け取った帳票が領収書か請求書かを自動判別したい場合、

今まで受け取った領収書と請求書の画像を学習データにしてDLに学習させて、できた簡単とか言う奴いるけど
・未知の帳票フォーマットに対して有効なのかそれ?
・受け取った帳票は全部印字・記入済なんだが、そんなんで学習していいのか?(未記入帳票は不要なの?)

そんなんには怖くってまかせられないんだが、おいらの感覚は合ってるよね
513
(1): (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)07:52 ID:u2uFhB8a0(3/6) AAS
たとえば文字枠のある用紙に書かれた手書き文字を OCR する場合

・手書き文字だから枠からはみ出すし、はみ出す位置もさまざまだし、
・文字枠も1桁ごとだったり3桁ごとだったり点線だったりキリがない

こういうのは対象画像をそのまま(枠付きで)DLに学習させても、読めますよなんてとても言えんと思うんだが。最近はそうでもないのか?

昔は専門家がデータ眺めてうんうん唸ってロジックを考えていたが、そういうのも大切だよねと
514
(1): (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)08:12 ID:u2uFhB8a0(4/6) AAS
あと、学習データで評価してお客に報告するアホ技術者?もシリウスβあたりに左遷して欲しい
スキャンしなおしたら同じ紙でも別データだよね、とかいうやつも

正読率80%はぎりぎり最低ラインで、どんな方法を使ってもこの程度はいきます
95%を超えるあたりからが勝負です。頑張りましょうね。と言いたい
517: (ワッチョイ 8d7c-TPhO [122.218.227.106]) 2022/05/07(土)13:59 ID:u2uFhB8a0(5/6) AAS
>>516
誰が何を確認するの?
学習データとして妥当なのかそれ、という話なんだが
522: (ワッチョイ 8d7c-PvPk [122.218.227.106]) 2022/05/07(土)15:00 ID:u2uFhB8a0(6/6) AAS
>>518
学習データの妥当性って基本的にベンダー側が確認するもんだよね?
お客さん的には、領収書と請求書が見分けられる提案が貰えれば、他はどうでもいい。
ベンダー側の危機感知能力に依存するんじゃないだろうか。
しくじると悲惨。しかも試験運用では完璧だったりする。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 1.690s*