[過去ログ] 【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net (882レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
511(2): 名無しさん@お腹いっぱい。 [sage] 2022/05/23(月)11:27 ID:7qUjQCGH0(1/4)
読取り革命14を使用しています.PDFに透明テキストで出力していますが,デフォルト(自動)ではフォントサイズが小さくて選択したときに表示文字列よりも小さくななります.
メニューの「結果」で領域ごとの設定できますが300頁の専門書の自炊では領域ごとの設定ですと手間がかかりすぎます.
手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.
513: 名無しさん@お腹いっぱい。 [sage] 2022/05/23(月)20:52 ID:7qUjQCGH0(2/4)
>>512
お言葉ですけど自分はスキャナー 添付の OCR ソフト、アクロバット 添付の OCR ソフト、Google の OCR ソフト、e.Typist、本格読み取りなども全部試して縦書きのアルファベット 混在、図表混在のOCR 認識は読取革命が群を抜いてるという結論に落ち着きました。読取革命の強みは1ページを領域ごとに認識方法をカスタマイズできることです。読取革命 の評価が低い人はマニュアルが分かりにくいためにおまかせ設定だけで使って性能を100%引き出してないのだと思います。
私の質問の解決方法が見つかればほぼ完璧です。
516: 名無しさん@お腹いっぱい。 [sage] 2022/05/23(月)21:24 ID:7qUjQCGH0(3/4)
>>514
ScanSnap は試したことがないので分かりません
517(1): 名無しさん@お腹いっぱい。 [sage] 2022/05/23(月)21:29 ID:7qUjQCGH0(4/4)
>>515
領域に分けてそれぞれずっとか表とか横書き縦書きとか指定すればかなり認識精度は高いです。簡単認識設定で標準の領域設定を使い、図表が混在しているページだけ手で領域を複数に分割して設定すれば割合効率的にできます。自動レイアウト機能で認識させるとおっしゃるように手直しが大変ですね。
他のソフトは読取革命臍のカスタマイズの機能がないので縦書きのアルファベット図表混在は使い物になりませんでした
横書きの英語はアクロバットが一番いいです
Google のは認識はいいのですがレイアウトがぐちゃぐちゃになるのと元の PDF の上に非透明テキストを重ねる機能がないのでつかえないです
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.028s