[過去ログ] 【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net (882レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
863: 名無しさん@お腹いっぱい。 [] 2023/10/03(火)06:17 ID:8+ujl4QD0(1)
512 x 512に区切って処理してて、256でウインドウをスライドさせているので256の倍数だと
最後のブロックに余りが出ないですね。
864: 名無しさん@お腹いっぱい。 [sage] 2023/10/04(水)20:44 ID:vRUF6acm0(1)
>>860
ベクターあたりでの公開希望
865: 名無しさん@お腹いっぱい。 [sage] 2023/10/09(月)23:35 ID:WG0A8Uhb0(1)
iOS17から縦書き日本語が読み取れるようになった
APIなりSDKあれば縦書き日本語OCRでは最強かもしれん知らんけど
ペラ紙書類の縦書きはもうiPhoneで完結だわ
866(1): 名無しさん@お腹いっぱい。 [] 2023/10/19(木)07:36 ID:zGVZ5rc10(1)
>>0860
私もEPUBから青空文庫形式への変換を試みています
がEPUBの仕様の自由度が高くて難航しています。
出来れば公開してほしいです
お願いいたします。
867: 名無しさん@お腹いっぱい。 [sage] 2023/10/19(木)09:00 ID:9iReVXET0(1)
公開するとメンテナンスしなきゃならないし、バグ対象はともかくおま環にまで対応しなきゃならないしエラー処理も細かく作らなきゃならないからヤダ。
868: 名無しさん@お腹いっぱい。 [sage] 2023/10/19(木)09:27 ID:bNKbLe6D0(1)
epub, mobi →青空文庫の変換は対応タグに違いがいろいろあって、青空文庫では調整できないのも多いし、一部は標準化されてなくてビュアーごとの独自拡張だったりする。
結局、書籍の特徴や自分の好みや使ってるツールに合わせて決め打ちで変換することになる。汎用のツールを作るのは無理。
869: 名無しさん@お腹いっぱい。 [sage] 2023/10/30(月)01:26 ID:zJhf5BLT0(1)
>>866
https://kyukyunyorituryo.github.io/aozora/
870: 名無しさん@お腹いっぱい。 [] 2023/10/31(火)01:41 ID:dvkv99P10(1)
pdfに画像透明テキスト埋め込みするのって最適のライブラリって何かあるですか?
縦書きに対応は必須で、ふりがなに対応できるとうれしい。
それとも、コピペするとき不便だから、ふりがなは除去して埋め込むのが普通ですかね
871: 名無しさん@お腹いっぱい。 [] 2023/11/05(日)14:23 ID:0L6HLOnn0(1/3)
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、
無料のCapture2Text試しましたが使い物にならなくて
872: 名無しさん@お腹いっぱい。 [] 2023/11/05(日)14:24 ID:0L6HLOnn0(2/3)
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、
無料のCapture2Text試しましたが使い物にならなくて
873(1): 名無しさん@お腹いっぱい。 [] 2023/11/05(日)14:24 ID:0L6HLOnn0(3/3)
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、
無料のCapture2Text試しましたが使い物にならなくて
874: 名無しさん@お腹いっぱい。 [sage] 2023/11/05(日)15:35 ID:UJ3RQ2Wr0(1)
使ってないから違うかもだがCapCapはどう?
875: 名無しさん@お腹いっぱい。 [sage] 2023/11/05(日)15:46 ID:dDirpvM+0(1)
スマホのGoogle翻訳アプリで画面撮影。
876: 名無しさん@お腹いっぱい。 [] 2023/11/07(火)11:11 ID:g1O/GcqC0(1)
bunkoOCRの作者様へ
要望が有ります
1.
ルビに関係ない所に挿入された特殊文字(U+FFF9からU+FFFB)は、無視してほしい
2.
行頭の全角スペースと”「”の認識精度を上げてほしい
3.
青空文庫形式での出力時は以下の文字を置換してほしい
ルビ以外外での「《」を「[#始め二重山括弧]」に
ルビ以外外での「》」を「[#終わり二重山括弧]」に
縦書き未対応の記号の「≪」を「[#始め二重山括弧]」に
縦書き未対応の記号の「≫」を「[#終わり二重山括弧]」に
★変換したい文字は、ファイルで指定できればなお良い
4.
空行も出力してほしい
自炊小説の場合は空行も重要です
877: 名無しさん@お腹いっぱい。 [sage] 2023/11/07(火)13:45 ID:EgBq2MV30(1)
>>873
PCOTならデスクトップは無理だがアプリ内OCR&翻訳はいける
878: 名無しさん@お腹いっぱい。 [] 2023/11/08(水)19:09 ID:EULq7AvV0(1)
>>0873
ソフトウェアとして配布はされていませんが
以下のリンク先の記事は参考になりませんか?
https://qiita.com/gabigabi/items/2c58eb9a500fc0b33e19
879(1): 名無しさん@お腹いっぱい。 [] 2023/11/09(木)02:26 ID:cayyqdYs0(1)
>>0876
ルビが変なところに認識されるのは、孤立したものを除くルーチンがバグっているので直します
今、認識エンジンを再学習させているので、行頭の認識ももう少し改善する予定です
文字置換は、なにか変換テーブルを作ればいいのかしら
空行については、実は仕組み上めっちゃむずいのでちょっと考えます。
文字のブロックの座標は取れるのですが、その間隔が何行に相当するかをちゃんと
算出するのがかなりむずい。
今は、ブロックごとに空行を1行挟んで出力しています。
章番号とかも明後日に飛んでいくので、本当は間にちゃんと挟みたいのですが。
880: 名無しさん@お腹いっぱい。 [] 2023/11/09(木)05:17 ID:HO7qvDxE0(1)
>>879
876です
回答ありがとうございます。
改善に期待しています
さて、文字の置換については
>>文字置換は、なにか変換テーブルを作ればいいのかしら
この方向でお願いします
実装して頂けるのであれば、ルビの表記の変換前に挿入して下さい
青空文庫形式の時のみの仕様ですので、他の形式には影響が
無いようにお願いします。
881(1): 名無しさん@お腹いっぱい。 [sage] 2023/11/10(金)21:38 ID:qu/YelkG0(1)
Googleレンズみたいにリアルタイムにレシートを読み取ってくれるのがないか検索。
https://www.isp21.co.jp/solution/quickdata/
リアルタイムテキスト解析
独自のかざしOCR技術
spexperts が かざしOCR を利用
spexperts は LINEレシートを提供
でもLINEレシートは写真撮影してから解析で時間かかる。かなり正確だけど。
882: 名無しさん@お腹いっぱい。 [] 2023/11/11(土)00:14 ID:bRi6xLZA0(1)
memo
>>881
特許6435017
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.010s