[過去ログ]
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net (882レス)
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net http://egg.5ch.net/test/read.cgi/software/1470745451/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
863: 名無しさん@お腹いっぱい。 [] 2023/10/03(火) 06:17:08.75 ID:8+ujl4QD0 512 x 512に区切って処理してて、256でウインドウをスライドさせているので256の倍数だと 最後のブロックに余りが出ないですね。 http://egg.5ch.net/test/read.cgi/software/1470745451/863
864: 名無しさん@お腹いっぱい。 [sage] 2023/10/04(水) 20:44:44.74 ID:vRUF6acm0 >>860 ベクターあたりでの公開希望 http://egg.5ch.net/test/read.cgi/software/1470745451/864
865: 名無しさん@お腹いっぱい。 [sage] 2023/10/09(月) 23:35:14.38 ID:WG0A8Uhb0 iOS17から縦書き日本語が読み取れるようになった APIなりSDKあれば縦書き日本語OCRでは最強かもしれん知らんけど ペラ紙書類の縦書きはもうiPhoneで完結だわ http://egg.5ch.net/test/read.cgi/software/1470745451/865
866: 名無しさん@お腹いっぱい。 [] 2023/10/19(木) 07:36:34.92 ID:zGVZ5rc10 >>0860 私もEPUBから青空文庫形式への変換を試みています がEPUBの仕様の自由度が高くて難航しています。 出来れば公開してほしいです お願いいたします。 http://egg.5ch.net/test/read.cgi/software/1470745451/866
867: 名無しさん@お腹いっぱい。 [sage] 2023/10/19(木) 09:00:07.52 ID:9iReVXET0 公開するとメンテナンスしなきゃならないし、バグ対象はともかくおま環にまで対応しなきゃならないしエラー処理も細かく作らなきゃならないからヤダ。 http://egg.5ch.net/test/read.cgi/software/1470745451/867
868: 名無しさん@お腹いっぱい。 [sage] 2023/10/19(木) 09:27:27.40 ID:bNKbLe6D0 epub, mobi →青空文庫の変換は対応タグに違いがいろいろあって、青空文庫では調整できないのも多いし、一部は標準化されてなくてビュアーごとの独自拡張だったりする。 結局、書籍の特徴や自分の好みや使ってるツールに合わせて決め打ちで変換することになる。汎用のツールを作るのは無理。 http://egg.5ch.net/test/read.cgi/software/1470745451/868
869: 名無しさん@お腹いっぱい。 [sage] 2023/10/30(月) 01:26:39.09 ID:zJhf5BLT0 >>866 https://kyukyunyorituryo.github.io/aozora/ http://egg.5ch.net/test/read.cgi/software/1470745451/869
870: 名無しさん@お腹いっぱい。 [] 2023/10/31(火) 01:41:42.92 ID:dvkv99P10 pdfに画像透明テキスト埋め込みするのって最適のライブラリって何かあるですか? 縦書きに対応は必須で、ふりがなに対応できるとうれしい。 それとも、コピペするとき不便だから、ふりがなは除去して埋め込むのが普通ですかね http://egg.5ch.net/test/read.cgi/software/1470745451/870
871: 名無しさん@お腹いっぱい。 [] 2023/11/05(日) 14:23:45.25 ID:0L6HLOnn0 PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、 無料のCapture2Text試しましたが使い物にならなくて http://egg.5ch.net/test/read.cgi/software/1470745451/871
872: 名無しさん@お腹いっぱい。 [] 2023/11/05(日) 14:24:06.46 ID:0L6HLOnn0 PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、 無料のCapture2Text試しましたが使い物にならなくて http://egg.5ch.net/test/read.cgi/software/1470745451/872
873: 名無しさん@お腹いっぱい。 [] 2023/11/05(日) 14:24:11.27 ID:0L6HLOnn0 PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、 無料のCapture2Text試しましたが使い物にならなくて http://egg.5ch.net/test/read.cgi/software/1470745451/873
874: 名無しさん@お腹いっぱい。 [sage] 2023/11/05(日) 15:35:03.26 ID:UJ3RQ2Wr0 使ってないから違うかもだがCapCapはどう? http://egg.5ch.net/test/read.cgi/software/1470745451/874
875: 名無しさん@お腹いっぱい。 [sage] 2023/11/05(日) 15:46:34.82 ID:dDirpvM+0 スマホのGoogle翻訳アプリで画面撮影。 http://egg.5ch.net/test/read.cgi/software/1470745451/875
876: 名無しさん@お腹いっぱい。 [] 2023/11/07(火) 11:11:28.34 ID:g1O/GcqC0 bunkoOCRの作者様へ 要望が有ります 1. ルビに関係ない所に挿入された特殊文字(U+FFF9からU+FFFB)は、無視してほしい 2. 行頭の全角スペースと”「”の認識精度を上げてほしい 3. 青空文庫形式での出力時は以下の文字を置換してほしい ルビ以外外での「《」を「[#始め二重山括弧]」に ルビ以外外での「》」を「[#終わり二重山括弧]」に 縦書き未対応の記号の「≪」を「[#始め二重山括弧]」に 縦書き未対応の記号の「≫」を「[#終わり二重山括弧]」
に ★変換したい文字は、ファイルで指定できればなお良い 4. 空行も出力してほしい 自炊小説の場合は空行も重要です http://egg.5ch.net/test/read.cgi/software/1470745451/876
877: 名無しさん@お腹いっぱい。 [sage] 2023/11/07(火) 13:45:16.04 ID:EgBq2MV30 >>873 PCOTならデスクトップは無理だがアプリ内OCR&翻訳はいける http://egg.5ch.net/test/read.cgi/software/1470745451/877
878: 名無しさん@お腹いっぱい。 [] 2023/11/08(水) 19:09:27.13 ID:EULq7AvV0 >>0873 ソフトウェアとして配布はされていませんが 以下のリンク先の記事は参考になりませんか? ttps://qiita.com/gabigabi/items/2c58eb9a500fc0b33e19 http://egg.5ch.net/test/read.cgi/software/1470745451/878
879: 名無しさん@お腹いっぱい。 [] 2023/11/09(木) 02:26:10.64 ID:cayyqdYs0 >>0876 ルビが変なところに認識されるのは、孤立したものを除くルーチンがバグっているので直します 今、認識エンジンを再学習させているので、行頭の認識ももう少し改善する予定です 文字置換は、なにか変換テーブルを作ればいいのかしら 空行については、実は仕組み上めっちゃむずいのでちょっと考えます。 文字のブロックの座標は取れるのですが、その間隔が何行に相当するかをちゃんと 算出するのがかなりむずい。 今は、ブロックごとに空行を1行挟んで出力
しています。 章番号とかも明後日に飛んでいくので、本当は間にちゃんと挟みたいのですが。 http://egg.5ch.net/test/read.cgi/software/1470745451/879
880: 名無しさん@お腹いっぱい。 [] 2023/11/09(木) 05:17:19.73 ID:HO7qvDxE0 >>879 876です 回答ありがとうございます。 改善に期待しています さて、文字の置換については >>文字置換は、なにか変換テーブルを作ればいいのかしら この方向でお願いします 実装して頂けるのであれば、ルビの表記の変換前に挿入して下さい 青空文庫形式の時のみの仕様ですので、他の形式には影響が 無いようにお願いします。 http://egg.5ch.net/test/read.cgi/software/1470745451/880
881: 名無しさん@お腹いっぱい。 [sage] 2023/11/10(金) 21:38:20.35 ID:qu/YelkG0 Googleレンズみたいにリアルタイムにレシートを読み取ってくれるのがないか検索。 https://www.isp21.co.jp/solution/quickdata/ リアルタイムテキスト解析 独自のかざしOCR技術 spexperts が かざしOCR を利用 spexperts は LINEレシートを提供 でもLINEレシートは写真撮影してから解析で時間かかる。かなり正確だけど。 http://egg.5ch.net/test/read.cgi/software/1470745451/881
882: 名無しさん@お腹いっぱい。 [] 2023/11/11(土) 00:14:35.40 ID:bRi6xLZA0 memo >>881 特許6435017 http://egg.5ch.net/test/read.cgi/software/1470745451/882
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.016s