[過去ログ] 【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net (882レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1: 2016/08/09(火)21:24 ID:zXdCMkkb0(1) AAS
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
2: 2016/08/15(月)08:48 ID:/8XKPL210(1) AAS
213 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2016/08/15(月) 01:37:00.10 ID:FQ3AgcG50
>>211
教えてあげないよ
     _,∩_         _,∩_           _,∩_
    (_____)ゝ、     (_____)    y     (_____)
    / :: :: :: ヽ 〉     /-‐:: ::‐-ヽ /       / :: :: :: ヽ
   _./ (・ )ll(・ ) ∨     _/  0) i! 0) ∨      _/ ( ・)i!(・ ) ゙、_
 // :: :: ∈ゝ :: ::ヽ   // ::  ‐-‐ :: ヽ    //  :: ー一 :: ヽ\
. ゝ/:: :: ::  :: :: ::ヽ  ゝ/ :: ::  ::  :: :: ヽ   ゝ/ :: ::  ::  :: :: ヽく
   ̄ ̄ | ̄ ̄ | ̄ ̄     ̄ ̄ | ̄ ̄ | ̄ ̄     ̄ ̄ | ̄ ̄ | ̄ ̄
省3
3: 2016/09/16(金)18:53 ID:xb+uDKDF0(1) AAS
個人的には流行ってほしいジャンルだけど
基本シェアウェアだしスレの伸び見ても需要無いんだな
4
(1): 2016/10/18(火)21:15 ID:8+1fcpg80(1/3) AAS
OCRソフト 製品版

メディアドライブ(株)
 e.Typist v.15.0   58ヵ国語対応   直販価格   19,800円(税別)
 e.Typist NEO v.15.0   日本語・英語のみ   直販価格   12,190円(税別)
体験版アリ
   http://mediadrive.jp/products/et/index11.html

パナソニックソリューションテクノロジー(株)
 読取革命Ver.15         直販価格   12,800(税別)
(読取革命Ver.15 lite for Mac同梱)
体験版アリ
省5
5: 2016/10/18(火)21:20 ID:8+1fcpg80(2/3) AAS
現行の出回ってる製品くらい並べろよ>1と思ったら、なんだ? NGワードって?
6
(1): 2016/10/18(火)21:29 ID:8+1fcpg80(3/3) AAS
>4に続けて以下のをアップしたかったんだけど、NGワード食らって弾かれるな…。

(株)データデジタルのRealReader Lite 8
(株)エーディーディーのABBYY FineReader 12
アンテナハウス(株)の瞬簡PDF OCR
Rene.E LaboratoryのRenee PDF Aide
7: 2016/10/19(水)21:34 ID:rrkqSMxv0(1) AAS
無料で使えるOCR

46ヶ国の言語に対応した無料で使えるオンラインOCR
Online OCR
   http://www.onlineocr.net

日本語の解説はココが分かりやすいかも
寝ログ
   http://nelog.jp/online-ocr

試してみたが確かにすげえ。
縦書き日本語にも対応していて認識率も悪くない。
ユーザー登録すればできることはさらに増えるが、
省10
8
(2): 2016/10/27(木)14:01 ID:Lf4Jkeck0(1) AAS
Googleドキュメントに丸投げが1番楽で精度も高い
つまり上で名前の上がってるようなソフトは今や全てゴミ
9: 2016/10/28(金)14:32 ID:F8pwlOl00(1) AAS
>>8
ファイルサイズが2MB制限だった。
これでは使い物にならない
ゴミとしか言いようがない
10
(3): 2016/11/14(月)10:01 ID:DfhqfMU20(1) AAS
acrobat以外でバラのpdfファイル一括OCR処理できるソフトないんかな。
今まではacrobatのフォルダ(500個ほどのファイル)ごと投げてたんだけど、特定のファイルで毎回止まってて使い物にならん。
11: 2016/11/23(水)20:08 ID:egsPu78e0(1) AAS
>>10
結局e.typistで保存するときの、ファイルごとに保存できたから、解決した。
12: 2016/11/30(水)19:15 ID:7ipzPm4D0(1) AAS
はじめまして。

現在OCR ソフト作っているものです。

スマホで出来ます。
現在うまく行っております。
13
(1): 2016/12/26(月)01:47 ID:v6AIeIuc0(1) AAS
スマホでOCR

カメラを内臓しているスマホの方が『買い物した直後にレシートをスキャンしてテキスト化したい』
という需要を満たせるせいか、Windows用ソフトが先細っている間に『Google Cloud Vision API』
という流行りのAIとかディープラーニングの技術を投入したAPIをOCRエンジンにしたスマホアプリが
公開されて成果をあげている模様。

結局自炊にはtesseract-ocrか?

で、この『Google Cloud Vision API』という奴、すこぶる評判が良いを通り越して
『もし的中率100%の占い師とか予想屋が実在したら?』レベルの優秀さだとすると、

自炊でのテキスト化に使用
 →正解率が高すぎて手直しの必要がほとんどない
省7
14
(2): 2017/01/01(日)03:49 ID:i4KtsT1l0(1) AAS
Tesseract-OCR良いね
パソコンのWindows版3.02を使ってみたけどGoogleドキュメントより精度が上だった
無料OCRツールでは一番か?
本当は最新の3.05使いたかったがうまく動かせなかった
15: 2017/01/01(日)10:45 ID:bJoGCIrB0(1) AAS
>>14
Googleが一番やろ〜w
16
(3): 2017/01/03(火)01:48 ID:/4niW42M0(1) AAS
tesseract-ocrの認識率を下げないための工夫

tesseract-ocrで検索すると、認識率を上げるための学習ファイルの作り方を指南したサイトが
それなりにヒットしますが、やはり自炊を目的とした日本語縦書き300ページ程度をOCRするため
の指南役サイトは見たことがありません。仕方なく自分で試行錯誤した結果、

1.スキャンする時に解像度300dpi以上の.tiff形式で行う

※当方の環境はlinux上でtesseract-ocr3.03と3.04を試しています。

構造上ノイズだらけのjpegだと肉眼には優しくてもソフトウェアにとってはそうではないみたい
で、当初オフィス用複合機のPDFでスキャンしてjpegに変換して読み込ませてみたのですが、そ
の結果は惨憺たるものでした。
省11
17
(1): 2017/01/03(火)02:13 ID:R8/S2ECj0(1) AAS
>>16
いやtesseractは認識精度低いから・・・

Cloud Vision使えよ

高画質画像もいらないから
18: 2017/01/04(水)00:37 ID:orymQRzs0(1) AAS
>>16
こういう検証報告はすごい有り難いね
参考にします
19: 2017/01/05(木)20:18 ID:8PejRFef0(1/3) AAS
ちなみに>16でスキャンする元ネタをjpeg→tiffに変更してどのくらい変わったかというと、

文中の“由美子”というヒロインの名前が、from-jpegスキャンからだと、

由美F   由美汗  由芙干  山芙杆  …芙杆
由美P   由美浙  由芙折  山芙F   …芙浙
由美f   由美肝  由芙於  山芙f   …芙肝
由美そ  由美託  由芙旛  山芙そ  …芙託
由美ア  由美醇  由芙杆  山芙ヂ  …美F
由美チ  由美干  由芙浙  山芙浙  …美f
由美ヂ  由美折  由芙F   山芙肝  …美肝
由美モ  由美杆  由芙f   山芙軒  …美チ
省14
20: 2017/01/05(木)20:59 ID:8PejRFef0(2/3) AAS
続・tesseract-ocrの認識率を下げないための工夫

2.不要な認識候補文字をブラックリストで指定して排除する

※当方の環境はlinux上でtesseract-ocr3.03と3.04を試しています。

以前tesseract-ocr以外のOCRソフトを使ったときのこと。帳票というか、罫線の中に数字と
カンマとピリオドしかないペーパーをスキャンして取り込むために認識候補を『英数のみ』に
設定してOCRを実行したのですが、

「なんで 2 じゃなくて Z って認識するワケ? 候補を数字だけに絞れば良さそうなのに、
なんでできないの? バカなの? 死ぬの?」
省11
1-
あと 862 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.278s*