【文字認識】OCRソフト(3文字目)【 自炊 】 (670レス)
【文字認識】OCRソフト(3文字目)【 自炊 】 http://egg.5ch.net/test/read.cgi/software/1711002779/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
1: 名無しさん@お腹いっぱい。 [sage] 2024/03/21(木) 15:32:59.39 ID:L+i98pj10 光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト 主なOCRソフトウェア(市販ソフト) ・読取革命16(開発元パナソニック、販売元ソースネクスト) ・本格読取5(開発元パナソニック、販売元ソースネクスト) ・e.Typist v.15.0(メディアドライブ) ・ABBYY FineReader PDF 16(ABBYY) 主なOCRソフトウェア(フリーソフト) ・tesseract-ocr ・PaddleOCR ・RapidOCR ・NDLOCR ・MangaOCR ・bunkoOCR 過去スレ 【文字認識】OCRソフト【 自炊 】 https://egg.5ch.net/test/read.cgi/software/1470745451/l50 【文字認識】OCRソフト(2文字目)【 自炊 】 https://egg.5ch.net/test/read.cgi/software/1701326685/l50 http://egg.5ch.net/test/read.cgi/software/1711002779/1
571: 名無しさん@お腹いっぱい。 [sage] 2025/04/04(金) 22:05:18.07 ID:++fNMCDT0 そうしたらみんな左上から右に向かって解析できる http://egg.5ch.net/test/read.cgi/software/1711002779/571
572: 名無しさん@お腹いっぱい。 [] 2025/04/04(金) 23:10:01.91 ID:xONGlnES0 568 です。 レスポンス、ありがとうございます。気長に待ってます。 現版5.7G!!でかい。 1Mbit/secでダウンロード14時間余かかりました。 256Gメモリー・ステックにセーブ試みるとエラー「大きすぎ、保存不可」 ベクター・フリー・ソフトの[ファイル分割 FDHoot]で分割して保存しました。 色んな方々のお世話になってます。 http://egg.5ch.net/test/read.cgi/software/1711002779/572
573: 名無しさん@お腹いっぱい。 [] 2025/04/05(土) 07:59:20.85 ID:5gmEcGA80 あんまりにアーカイブサイズがでかいので、自分の要らないプラグインに必要なdllを外してダウンロードできる ダウンローダ作るわ。DirectMLの人やCPUの人はcuda要らないものね http://egg.5ch.net/test/read.cgi/software/1711002779/573
574: 名無しさん@お腹いっぱい。 [sage] 2025/04/10(木) 05:03:58.39 ID:DVbx1C1T0 bunkoOCRすごいね 久々に感動した http://egg.5ch.net/test/read.cgi/software/1711002779/574
575: 名無しさん@お腹いっぱい。 [sage] 2025/04/10(木) 09:02:23.68 ID:AvcOBBMH0 bunkoOCRは色々改良していただいているようだが更新公開頻度を上げていただけるといいんだが・・・ http://egg.5ch.net/test/read.cgi/software/1711002779/575
576: 名無しさん@お腹いっぱい。 [] 2025/04/10(木) 10:20:07.21 ID:T2B8zrS10 >>575 すまんの。自分で使ったり報告があったバグを潰してたら、バグのモグラ叩きになってて時間かかってたです。 iOSの方で直したやつを、Windowsの方に持ってきてる形なので、遅くなってます http://egg.5ch.net/test/read.cgi/software/1711002779/576
577: 名無しさん@お腹いっぱい。 [sage] 2025/04/10(木) 14:20:39.96 ID:P8TyB0Jh0 主流のcuda以外も見捨てずに対応してくれるだけで大感謝です 2年前のに比べて認識精度がかなり上がっているので昔OCRしたものも再度やり直してます http://egg.5ch.net/test/read.cgi/software/1711002779/577
578: 名無しさん@お腹いっぱい。 [] 2025/04/12(土) 15:53:51.86 ID:BULBwN9g0 透明テキストPDF化をなにとぞお願いいたします http://egg.5ch.net/test/read.cgi/software/1711002779/578
579: 名無しさん@お腹いっぱい。 [sage] 2025/04/13(日) 08:24:07.90 ID:xMwpL3+B0 全ファイルのOCRが完了した時に何らかの音が鳴ると嬉しいですね 以前と違ってかなり早く終わるので気づかないことも多い http://egg.5ch.net/test/read.cgi/software/1711002779/579
580: 名無しさん@お腹いっぱい。 [sage] 2025/04/14(月) 02:02:21.59 ID:ENlBum6U0 GUIだけでなくCUIでも動作できるようにしていただけると超うれしいですが、優先度は低めでも http://egg.5ch.net/test/read.cgi/software/1711002779/580
581: 名無しさん@お腹いっぱい。 [] 2025/04/14(月) 04:07:41.77 ID:V0n1487Y0 >>580 基本的には、OCRengine.exeでほとんど処理してるので、標準入力に順番に対象ファイルを入れて行けば処理される感じです。 次のやつにコマンドラインから呼ぶ時の方法も書いておきますね。 http://egg.5ch.net/test/read.cgi/software/1711002779/581
582: 名無しさん@お腹いっぱい。 [sage] 2025/04/14(月) 10:42:25.37 ID:ENlBum6U0 >>581 ありがとうございます!気長にお待ちしております http://egg.5ch.net/test/read.cgi/software/1711002779/582
583: 名無しさん@お腹いっぱい。 [sage] 2025/04/14(月) 20:27:42.51 ID:vcf9bSuT0 連続した会話文で2つ目以降の「(カギカッコ)が抜ける例ですが bunkoocrの最新のバージョンですと、ある程度の高解像度の画像ファイルならほぼ無くなりましたが 古いスキャナやデジカメで撮影したような低解像度のファイルだとたまに出てきますね 文意はわかるのであまり気にはなりませんが http://egg.5ch.net/test/read.cgi/software/1711002779/583
584: 名無しさん@お腹いっぱい。 [] 2025/04/15(火) 02:55:05.25 ID:QrYL8PWV0 ゴミを除去するための空白閾値が高すぎると、細い文字や薄い文字が巻き込まれて除去されるので、0に近づけるとよいかも blank_cutoffというやつ。20だと薄めの字は飛ぶと思うです http://egg.5ch.net/test/read.cgi/software/1711002779/584
585: 代行 [] 2025/04/15(火) 06:33:59.42 ID:LOCXpazd0 >>1にあるフリーのOCRの中ではフロントエンドがないNDLOCRが一番敷居高い気がする http://egg.5ch.net/test/read.cgi/software/1711002779/585
586: 名無しさん@お腹いっぱい。 [] 2025/04/15(火) 11:03:36.31 ID:j4ru0Sre0 【脳科学】「政治行動の激しさ」に関連する脳回路の存在が研究で判明 [すらいむ★] http://egg.5ch.net/test/read.cgi/scienceplus/1744637408/ 上記のリンクをたどったリンク先の本文とコメントを読まれると・・・ 余裕ありますか・・・ 大々的にインターネット上にばらまかれました! http://egg.5ch.net/test/read.cgi/software/1711002779/586
587: 名無しさん@お腹いっぱい。 [sage] 2025/04/15(火) 19:23:00.94 ID:7bXQIrnr0 bunkoOCRさん、小説の節っていうのか知らないけど 1、2、3ってのが中盤にあっても文章の頭に表示されるのを修正してほしい 1 みたいになってるやつ 空白が多いと難しいのかな http://egg.5ch.net/test/read.cgi/software/1711002779/587
588: 名無しさん@お腹いっぱい。 [sage] 2025/04/16(水) 05:43:06.25 ID:Xe/B+xr80 本性露骨に露したな http://egg.5ch.net/test/read.cgi/software/1711002779/588
589: 名無しさん@お腹いっぱい。 [sage] 2025/04/16(水) 20:08:12.64 ID:nf8WVJSp0 >>572 分割するよりNTFSでフォーマットしたほうが早いと思う。 http://egg.5ch.net/test/read.cgi/software/1711002779/589
590: 名無しさん@お腹いっぱい。 [] 2025/04/16(水) 22:50:44.19 ID:Eccel3Mp0 >>572 です 新品のスティックならNTFSでフォーマットもありえます。 今回は、新品のスティックではなく、既に幾つかのファイルが保存されてる使いふるし品への追加です。 ベクター・フリー・ソフトの[ファイル分割 FDHoot]は手っ取り早く分割できました。 よくできてます。 http://egg.5ch.net/test/read.cgi/software/1711002779/590
591: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 16:38:47.18 ID:qQw+9RmR0 bunkoOCRで「こ」が「と」に認識されるのがあった 出版社によって使ってるフォントが違うせいだと思うけど 「こ」の間が「乙」みたいにつながってる文字が誤認識するみたい http://egg.5ch.net/test/read.cgi/software/1711002779/591
592: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 17:38:18.94 ID:IXNKC84m0 >>591 どこの出版社のやつとかわかりますか。次の再学習の時に入れたいので、サンプルになる本を教えていただけるとありがたいです http://egg.5ch.net/test/read.cgi/software/1711002779/592
593: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 18:39:07.75 ID:qQw+9RmR0 >>592 新潮文庫で辻村深月「ツナグ」という本です 「こ」の部分 https://i.imgur.com/RNf6Qv1.jpg http://egg.5ch.net/test/read.cgi/software/1711002779/593
594: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 19:29:33.60 ID:5r9yYGXf0 >>593 ありがとうございます。新潮文庫は、手持ちにあるので同様の文字が無いか確認してみます。 http://egg.5ch.net/test/read.cgi/software/1711002779/594
595: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 19:35:04.55 ID:5r9yYGXf0 あ、これ 内容からすると特別にフォント変えてあるのかな。実物見てみます。 http://egg.5ch.net/test/read.cgi/software/1711002779/595
596: 名無しさん@お腹いっぱい。 [sage] 2025/04/17(木) 19:55:06.63 ID:Fet/c6EA0 人間さんも読み間違いしそうで... aとoを読み間違える某教科書体にはムカついている。 http://egg.5ch.net/test/read.cgi/software/1711002779/596
597: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 20:14:07.75 ID:qQw+9RmR0 >>595 画像は「こ」が入ってるところを幾つか抽出して貼っただけです 小説全体でこんな感じのフォント使ってますね 探したところ講談社でも似たようなフォントで見つかりました http://egg.5ch.net/test/read.cgi/software/1711002779/597
598: 名無しさん@お腹いっぱい。 [sage] 2025/04/17(木) 20:28:26.15 ID:l3abfBfd0 bunkoocr様、目次や登場人物紹介のレイアウトが崩れるのはどうしようもないことなんでしょうか? 目次だと漢数字のページ数(一ニ三など)が全部まとめて文章後方に行って 見出し部分は前に固まる感じ 登場人物も、 人名A---------その説明文、のようなものですと中盤から崩れ始めます 数ページなので手動で直してもあまり手間はかかりませんが http://egg.5ch.net/test/read.cgi/software/1711002779/598
599: 名無しさん@お腹いっぱい。 [sage] 2025/04/17(木) 20:43:48.25 ID:l3abfBfd0 と、書き込んだら何やら興味深い話 新潮文庫は自分も10冊近くやりましたが画像とは違う繋がっていないフォントでしたね 文春・講談社・集英社・小学館・角川・朝日ソノラマなど150冊以上ocrしましたが そのような事例はなかったと思います ジャンルや発行年代が違うのかな? http://egg.5ch.net/test/read.cgi/software/1711002779/599
600: 名無しさん@お腹いっぱい。 [sage] 2025/04/17(木) 21:12:57.57 ID:GmXyYCXS0 作家によってはこだわりでフォントを指定してくることがある…みたいな話をなんかでみたことがある 出版関係者じゃないのでホントかどうかはしらんけど http://egg.5ch.net/test/read.cgi/software/1711002779/600
601: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 21:35:06.21 ID:5r9yYGXf0 >>598 iOS版では多分直ったと思うので、windows版に反映させているところです。 文のブロックの形成方法を少し修正しました。 http://egg.5ch.net/test/read.cgi/software/1711002779/601
602: 名無しさん@お腹いっぱい。 [sage] 2025/04/17(木) 21:46:53.46 ID:df3Tx6mU0 bunkoOCRを使わせてもらいましたがすごく良かったです。 だた「廣」が「広」になってしまうのが気になりました。 ある意味正しいのでしょうけど人名だったので手打ちで修正しました・・・ http://egg.5ch.net/test/read.cgi/software/1711002779/602
603: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 22:28:52.93 ID:5r9yYGXf0 「こ」も必ずしも失敗しないのがまた悩ましい https://i.imgur.com/n3bTQ0f.png >>602 旧字のあたりは、勝手に変換してしまう時があるんですよね。見つけ次第直してたんですが、 廣と広は学習が足りてなかったみたいです。 どこの学習データにそのへんの変換が入ってしまっているのかが実はよく分かってなくて。 文字コードと字体の変換テーブルが、新しい字の方になってしまっているフォントが 使っている中にあるのかな。 http://egg.5ch.net/test/read.cgi/software/1711002779/603
604: 名無しさん@お腹いっぱい。 [] 2025/04/17(木) 23:06:12.17 ID:5r9yYGXf0 >>597 ありがとうございます。貼っていただいた画像で試したところ、なぜか95%のサイズに縮小すると ちゃんと認識しました。 一応リサイズオプションつけたような気がするので、もしよければ試していただけますか。 今のモデルは、大きい字になった場合繋がっていると間違えるやすいようなので、追加学習でまた直しておきます。 http://egg.5ch.net/test/read.cgi/software/1711002779/604
605: 代行 [] 2025/04/19(土) 07:38:13.13 ID:XB6Cyug10 bunkoOCRの作者に聞きたいことがある ・Android版を作る予定はある? ・(NDL古典籍OCR-Liteみたいに)精度が多少落ちてもいいので、CPUのみで高速処理できるバージョンは作れる? http://egg.5ch.net/test/read.cgi/software/1711002779/605
606: 名無しさん@お腹いっぱい。 [sage] 2025/04/19(土) 10:56:57.48 ID:ITaD2JJG0 Android版なんていらんだろ http://egg.5ch.net/test/read.cgi/software/1711002779/606
607: 名無しさん@お腹いっぱい。 [] 2025/04/19(土) 11:41:42.75 ID:iEMWshJg0 >>605 Androidだと、性能の保証ができないので難しそうだなと。 なお、Androidのスマホをプレゼントしてくれるなら別ですけど、使ってないデバイスで開発するのは難しいです。 精度があんまり落ちないCPUバージョンは一応できましたが、これ以上速くするにはモデルサイズを 刈り込まないといけないのでちょと面倒。蒸留とかすればいいんでしょうけど、そんなにすぐにはできないです。 http://egg.5ch.net/test/read.cgi/software/1711002779/607
608: 名無しさん@お腹いっぱい。 [] 2025/04/19(土) 16:29:00.37 ID:rFpYTTcg0 bunkoocrで出力されたjsonファイルを皆さんはどうやって活用してるんですか? そのままじゃ読みにくいですよね epubやら変換するツールみたいなのがあるんですか? http://egg.5ch.net/test/read.cgi/software/1711002779/608
609: 代行 [] 2025/04/22(火) 07:32:38.20 ID:L2Zcjzd/0 >>607 >蒸留とかすればいいんでしょうけど、そんなにすぐにはできないです。 わかりました、無理に急がなくても大丈夫です http://egg.5ch.net/test/read.cgi/software/1711002779/609
610: 名無しさん@お腹いっぱい。 [sage] 2025/05/28(水) 15:57:35.30 ID:8Uj7rV060 しかしソフ板でなんでエロ広告? http://egg.5ch.net/test/read.cgi/software/1711002779/610
611: 名無しさん@お腹いっぱい。 [sage] 2025/06/18(水) 15:54:40.27 ID:qU06wBhm0 bunkoOCR作者様、とても重宝させてもらってます ありがとうございます ところで横書き縦書きを指定することはできないでしょうか 横書きの文書で各ページ中の4行ぐらいが縦書きに判定されてしまいます http://egg.5ch.net/test/read.cgi/software/1711002779/611
612: 名無しさん@お腹いっぱい。 [] 2025/06/18(水) 18:23:50.70 ID:Md5cQHFm0 >>611 windows版の方でしょうか。 オプション入れ忘れてる気がしますので、次のバージョンで足しておきますね http://egg.5ch.net/test/read.cgi/software/1711002779/612
613: 名無しさん@お腹いっぱい。 [sage] 2025/06/18(水) 20:05:12.30 ID:qU06wBhm0 >>612 Windows版です よろしくお願いします! http://egg.5ch.net/test/read.cgi/software/1711002779/613
614: 名無しさん@お腹いっぱい。 [sage] 2025/06/19(木) 13:48:15.39 ID:EanrVXIz0 次のバージョンはまだ時間がかかりそうですかね? 楽しみに待っています http://egg.5ch.net/test/read.cgi/software/1711002779/614
615: 名無しさん@お腹いっぱい。 [] 2025/06/19(木) 19:05:28.87 ID:VZAv1k7a0 ついでにTransformerの部分の再学習をさせてるので、もうちょいかかりそうです。 もう少しのところで微妙に精度が上がらないので苦しんでいるところです。 http://egg.5ch.net/test/read.cgi/software/1711002779/615
616: 名無しさん@お腹いっぱい。 [sage] 2025/06/20(金) 20:22:39.16 ID:WjXrk/tl0 >>615 ありがとうございます 作者様のおかげで私の自炊ライフはかなり捗っています もう数百冊自炊して一人でスマホの本棚画面を見てニヤニヤしてる感じです http://egg.5ch.net/test/read.cgi/software/1711002779/616
617: 名無しさん@お腹いっぱい。 [] 2025/06/23(月) 18:47:06.12 ID:LFHGqfnT0 ocrbunkoで、これみたいに括弧内が2行になってるの読み取り方法ありますか? https://i.imgur.com/LCXKvKF.jpeg http://egg.5ch.net/test/read.cgi/software/1711002779/617
618: 名無しさん@お腹いっぱい。 [] 2025/06/23(月) 20:37:06.16 ID:/qScaGrz0 >>617 19 インスマウスの影 たちが、いろいろ毛色の変わった各地の人間を連れてきたということもよくごぞんじのことと 思います。セイラム(マサチュセッツ州北東部にある港町)の男が支那人を妻にして帰ってきたという話をお聞きに なったことがあるでしょう。それに、ほら、どこかコッド岬(マサチュセッツ州にある大西洋につきだした岬)の近くに は、フィジー諸島(太平洋南部の英領植民地)の住民がいまでも大ぜいいるそうじゃありませんか。 まあ、なんですね、インスマウスの連中の背後には、なにかそんなことがあるにちがいあり ませんな。あの町は、沼や入江がたくさんあって、よその町とはいつも連絡が遮断されたよう な形になっているものですから、くわしいことはよくわからないんです。が、マーシュ老船長 が、自分に任されている三隻の船を使って、二十人、三十人と、妙な住民たちを連れ帰ったに ちがいないことだけは、かなりはっきりわかっています。現在インスマウスに住んでいる連中 には、確かに妙な特徴がありますな――もっともそれを、どう説明したらいいのかわたしには わかりませんが、なにかこう、背すじがむずむずしてくるようなものなんです。あのサージェ ントのバスにお乗りになれば、あの男にも、そういうところがあるから、ははあこれだな、と すぐわかりますよ。あの連中のなかには、妙に頭が狭くって鼻が平べったく、それに眼はふく らんでいて開きっぱなしみたいにじっと人をにらんでいるようなご面相のものがいるんですが、 こいつらの皮膚ときたら、お話になりません。鮫肌で吹きでものだらけだし、頸の両側はしわ だらけでくびれているんです。おまけに、若いうちから、頭が禿げるときています。年を取っ た連中は、それぁもう、見られたもんじゃありません――まったくの話が、あの連中をこの目 で見たときは、まさかと思いましたよ。自分の姿を鏡で見たら、きっと死ぬにちがいありませ こんな感じでよければ。 ふりがなの判定と、割注(文中に2行に分けて注釈を入れる)の判定が難しいので誤判定されることがあります。 この画像の場合、ちょっと文字が小さい(解像度が低い)ので、少し拡大すると判定が上手くいくようです。 x2.5くらいリサイズしてみてください。 http://egg.5ch.net/test/read.cgi/software/1711002779/618
619: 名無しさん@お腹いっぱい。 [] 2025/06/24(火) 05:48:46.88 ID:0WVb4N5Y0 >>617 ありがとうございます。帰ったらやってみます http://egg.5ch.net/test/read.cgi/software/1711002779/619
620: 名無しさん@お腹いっぱい。 [] 2025/06/24(火) 19:12:34.99 ID:0WVb4N5Y0 >>618 自分の環境では3倍でうまくいきました!ありがとうございます http://egg.5ch.net/test/read.cgi/software/1711002779/620
621: 名無しさん@お腹いっぱい。 [sage] 2025/06/29(日) 08:10:40.59 ID:iQ6N++/I0 非常に高速なプログラムではUIの更新がボトルネックになるそうだけど デバッグ出力を止めたら速くなりそう http://egg.5ch.net/test/read.cgi/software/1711002779/621
622: 名無しさん@お腹いっぱい。 [sage] 2025/06/29(日) 08:24:47.07 ID:iQ6N++/I0 エラーが発生したファイルはWait listに残りますが、もう一度やり直せませんか? Windows版です http://egg.5ch.net/test/read.cgi/software/1711002779/622
623: 名無しさん@お腹いっぱい。 [sage] 2025/07/22(火) 10:44:44.00 ID:n3CEfl3W0 読取革命を持っているがPDFにOCRをかけてPDFで保存すると元画像を維持できない FineReaderは画像を改変しないとのこと(AIで調べただけ) FineReaderを使っている方 いかがですか http://egg.5ch.net/test/read.cgi/software/1711002779/623
624: 名無しさん@お腹いっぱい。 [sage] 2025/07/22(火) 16:19:35.07 ID:n3CEfl3W0 FineReaderはバージョン16になるとサブスクだけになるようだ 今はまだソースネクストで15の買い切り版が買える 27,500円と安くはないけど ScanSnap付属の古いバージョンは持っているがOCR精度はよくない 元画像は維持されるから有料バージョンでも同じだとは思うが http://egg.5ch.net/test/read.cgi/software/1711002779/624
625: 名無しさん@お腹いっぱい。 [sage] 2025/07/28(月) 16:51:27.27 ID:z8/RWwAJ0 ScanSnap SV600に付属していたScanSnap Organizerをずっと使っていたが PCのクラッシュを機に後継のScanSnap Homeをインストールしてみた 日本語縦書き雑誌をOCRしてみたが精度は変わらなかった ScanSnap Homeは使いにくいので元に戻そうかな bunkoOCRの精度が最も高いことはわかっているがPDFに埋め込めないのが残念 http://egg.5ch.net/test/read.cgi/software/1711002779/625
626: 名無しさん@お腹いっぱい。 [] 2025/07/29(火) 04:24:38.85 ID:PZp6wd/J0 bunkoOCRで埋め込みPDFを作るべく、フォーマットのお勉強してるのでしばしお待ちを いまここまで来た https://github.com/lithium0003/pdf_addtext http://egg.5ch.net/test/read.cgi/software/1711002779/626
627: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 04:43:02.86 ID:xGNOwNOF0 すばらしい 楽しみにしてます http://egg.5ch.net/test/read.cgi/software/1711002779/627
628: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 08:58:00.52 ID:zpxe7x9j0 それはありがとうございます 期待してお待ちします もう1つお願いがあります 市販品のスペックを見るとオプションでOCRをリフローにできるものがあります https://www.sourcenext.com/Product/1000001825/ とか 改行が削除されることで改行をまたいだ検索ができます ご検討いただけるとうれしいです http://egg.5ch.net/test/read.cgi/software/1711002779/628
629: 名無しさん@お腹いっぱい。 [] 2025/07/29(火) 09:57:52.06 ID:dUNWvHL20 >>628 画像の文字の場所に埋め込むとすると、行の切れ目で分けざるを得ないのですが、 Acrobat readerとかは次の行っぽい場所にあればくっつけてくれるようです。 リフローOCR処理されたpdfのサンプルってありますか。どうやってるのかがわからないので、どうやって実装するのかかがわからんのです。 http://egg.5ch.net/test/read.cgi/software/1711002779/629
630: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 10:50:04.19 ID:zpxe7x9j0 >>629 Acrobat Readerのその挙動には気付いていましたが必ず検索できるとは限らないようです リフローならば確実に検索できるでしょうね PDF OCRソフトはほとんどサブスクになってしまってしかもボッタくりの値段ですね ソースネクストの旧版FineReader 15は買い切りなのでちょっと高いけど買って試してみようかと思っています (読取革命は買ってありますが問題外) http://egg.5ch.net/test/read.cgi/software/1711002779/630
631: 名無しさん@お腹いっぱい。 [] 2025/07/29(火) 12:27:50.42 ID:dUNWvHL20 >>630 場所がページ内のどこでもいいなら、全文貼るのは簡単なんですが。 場所を合わせつつ、切れないようにするのができないので、なんか裏技あるんかしらと http://egg.5ch.net/test/read.cgi/software/1711002779/631
632: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 14:14:05.95 ID:OmU0uGtN0 >>631 これとかどうですか https://www.antenna.co.jp/XSL-FO/sample/pdf/sample-writing-mode.pdf https://www.antenna.co.jp/AHF/ahf_samples/ja/fo/language/writing-mode-1.pdf http://egg.5ch.net/test/read.cgi/software/1711002779/632
633: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 18:26:38.14 ID:zpxe7x9j0 >>631 きちんとしたPDFエディタを持っていないのでFineReader 15を買ってみてしまいました リフローのオプションはPDFには無くて、テキストやワードファイルに保存する場合だけでした しかも段落の認識精度は低い けしからんことには画像を変えずにOCRの透明テキストを追加することができませんでした http://egg.5ch.net/test/read.cgi/software/1711002779/633
634: 名無しさん@お腹いっぱい。 [] 2025/07/29(火) 19:09:37.39 ID:PZp6wd/J0 >>632 サンプルありがとうございます。 いまのところこんな感じなんですが、内部的な処理としては同じようにTjコマンドで 順番に出してるのですけど、これで皆さんの環境で検索可能になってますか。 https://github.com/lithium0003/pdf_addtext/raw/main/Sample/IMG_2399.pdf >>633 ありがとうございます。 画像をそのままにして、ごにょごにょするのって実はめちゃくちゃむずいんです。 とりあえずの目標は、官報を全文検索可能にするテストですが、デコードややこしい。 模様の付いたタイトルとかも実は画像だったりもして、そういうのは弾かなきゃなのでまたややこしい http://egg.5ch.net/test/read.cgi/software/1711002779/634
635: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 19:42:41.45 ID:zpxe7x9j0 >>634 リフローなんてPDFではできないものだと思ってしまいました 余計なことを書いてすみませんでしたと謝らなければいけないのかと思ったのですが 官報を全文検索可能にするテストとは驚きました 期待しております サンプルはAcrobat Readerで検索できています http://egg.5ch.net/test/read.cgi/software/1711002779/635
636: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 20:20:13.41 ID:zpxe7x9j0 サンプルIMG_2399.pdfで「婆さん」を検索すると24行目末尾は検索されません リーダーが改行をまたいで検索するオプションを持っいてくれれば済む話だとと思うんですがね http://egg.5ch.net/test/read.cgi/software/1711002779/636
637: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 21:16:00.17 ID:Lj85Uz1y0 >>634 サンプルIMG_2399.pdf SmatraPDFで行末跨ぎ検索(「婆さん」など)やctrl+aで全選択してクリップボードコピーが出来ました ただし行が傾いているせいか、マウスでの文字選択がトリッキーです (選択してても所々カーソルの様な選択幅しか表示されない、実質無害ですが) PythonのMyMuPDF(SmatraPDFも同じmupdfエンジン)でもテキスト抽出できました http://egg.5ch.net/test/read.cgi/software/1711002779/637
638: 名無しさん@お腹いっぱい。 [sage] 2025/07/29(火) 21:38:58.51 ID:zpxe7x9j0 SmatraPDFは使ったことがありましたがそんな機能があったとは気付きませんでした 本家も見ならってほしい http://egg.5ch.net/test/read.cgi/software/1711002779/638
639: 名無しさん@お腹いっぱい。 [sage] 2025/07/30(水) 10:24:14.81 ID:kWSxFREE0 Acrobat Readerで行跨ぎ検索が効くのは検索語句が漢字語句かカタカナ語句に限られるような感じがする よって「婆さん」には効かない Windowsサーチ用のAcobat Reader付属のiFilterも同じである様子 http://egg.5ch.net/test/read.cgi/software/1711002779/639
640: 名無しさん@お腹いっぱい。 [] 2025/07/30(水) 17:33:30.37 ID:aKBiOqsf0 Mac版のAcrobat readerだと、「婆さん」で改行かかっててもヒットするな。バージョンによるのかしら 座標を絵に合わせてTmで配置し直してるけど、前の行の近傍にある場合だけ、後続のTjがくっつく動作になってるっぽい。 Macのプレビューだと、そういう行は切れちゃう。 http://egg.5ch.net/test/read.cgi/software/1711002779/640
641: 名無しさん@お腹いっぱい。 [sage] 2025/07/30(水) 17:41:22.40 ID:a4kXxPog0 自分はAcrobat ReaderをインストールしてないですがエクスプローラーからPDF検索出来てます (「婆さん」は何箇所もあるので別のものだと「そうした気候の恩恵」など) Windowsデフォルトのハンドラーが使われているようです (SumatraPDF IFilterもありますがインストールしてなかった) Computer\HKEY_CLASSES_ROOT\CLSID\{6C337B26-3E38-4F98-813B-FBA18BAB64F5} Reader Search Handler %systemroot%\system32\Windows.Data.Pdf.dll http://egg.5ch.net/test/read.cgi/software/1711002779/641
642: 名無しさん@お腹いっぱい。 [] 2025/07/30(水) 18:53:37.59 ID:q9Qt2B2X0 みなさん検証ありがとうです。 だいたい行けそうな気配がするので、この方針でpdf埋め込み行くことにします。 bunkoOCRに入れ込むので、もうちょっと待っててください。 http://egg.5ch.net/test/read.cgi/software/1711002779/642
643: 名無しさん@お腹いっぱい。 [sage] 2025/07/30(水) 18:59:27.02 ID:kWSxFREE0 自分のPCも調べたらWindows標準のPDF検索機能が使われていて「そうした気候の恩恵」もマッチしました Acrobat ReaderをインストールしていたのでてっきりそのiFilterだと思い込んでいました 何を見て「Windowsサーチ用のAcobat Reader付属のiFilterも同じである様子」なんていう嘘を書いてしまったんだろう すみませんでした Explorerの検索はよく使っているのでうれしい結果でした http://egg.5ch.net/test/read.cgi/software/1711002779/643
644: 名無しさん@お腹いっぱい。 [sage] 2025/07/30(水) 20:12:39.04 ID:bAZ+wc1s0 >>642 良かったです、よろしくお願いします >>643 すみません、少し複雑なので省略しました 実際にはここに書いてある順番で調べていく必要があります https://learn.microsoft.com/en-us/windows/win32/search/-search-ifilter-registering-filters https://learn.microsoft.com/ja-jp/windows/win32/search/-search-ifilter-registering-filters 自分の場合に使用されているifilterを示したかったのですが、>>641のレジストリーだけで決定されるわけではなく Computer\HKEY_LOCAL_MACHINE\SOFTWARE\Classes\.pdf\PersistentHandler (Defalut)={1AA9BF05-9A97-48c1-BA28-D9DCE795E93C} Computer\HKEY_CLASSES_ROOT\CLSID\{1AA9BF05-9A97-48c1-BA28-D9DCE795E93C}\PersistentAddinsRegistered\{89BCB740-6119-101A-BCB7-00DD010655AF} 下に>>641のCLSIDでの登録があるのでその部分だけ示しました iFilterの表示名だけであれば Win+Sサーチ -> Indexing Options -> Advancedボタン -> File Typesタブ -> リストのpdfまでスクロール で確認できると思います http://egg.5ch.net/test/read.cgi/software/1711002779/644
645: 名無しさん@お腹いっぱい。 [] 2025/07/31(木) 07:22:57.88 ID:fhhSIdzX0 スマホのアプリでいくつか試したけど上のサンプルのでもできたりできなかったりするのでアプリ側が行跨いで検索する機能があるかどうかがまずあって、 サンプルのだとできたアプリでも自前のpdfだとできる文章とできない文章があるからpdfでも対応してなきゃいけないみたいですね http://egg.5ch.net/test/read.cgi/software/1711002779/645
646: 名無しさん@お腹いっぱい。 [sage] 2025/07/31(木) 09:47:16.66 ID:CGA+N+8R0 AIに聞いてみたら行跨ぎ検索に対応しているリーダーはWinでは有償無償含めてSumatraしかないそうだ(AIは堂々と嘘書くから信用はしてないが) PDFでリフローのような構造が存在するのかどうかは存じませんがbunkoOCRテキスト出力にもリフローのオプションを用意していただけらうれしいです それくらい自分でスクリプトなりなんなり書けと言われてしまうかもしれませんが本体に機能があると便利ですので http://egg.5ch.net/test/read.cgi/software/1711002779/646
647: 名無しさん@お腹いっぱい。 [sage] 2025/07/31(木) 11:31:09.20 ID:6fw8HGOu0 ググったらAI Overviewと言うのが表示されて、リフローPDFなるものは無いそうです While PDF itself is not inherently reflowable, the Reflow feature in PDF viewers allows text to adjust to different screen sizes, making it easier to read on various devices. This feature is available in applications like Adobe Acrobat and similar PDF readers. Here's a more detailed explanation: PDFs are typically designed with a static layout: This means the text and images are placed in a fixed position on the page, similar to a printed document. Reflow mode rearranges the content: When you enable reflow in a PDF reader, the text is reorganized into a single column that adapts to the screen width, eliminating the need for horizontal scrolling when zooming in or reading on smaller screens. Not all PDFs are created equally: While reflow can improve readability for many PDFs, it doesn't always perfectly follow the reading order, especially if the PDF wasn't created with accessibility in mind, according to Fondazione LIA. Reflow is a viewing feature, not a file format change: It's a display setting within the PDF reader, not a permanent change to the PDF file itself. Converting to EPUB is another option: For more significant control over text size and layout, you can convert a PDF to the EPUB format, which is inherently reflowable. In summary: PDF reflow is a helpful feature in PDF readers that dynamically adjusts text for better readability on different screens, but it's not a fundamental characteristic of the PDF file format itself. http://egg.5ch.net/test/read.cgi/software/1711002779/647
648: 名無しさん@お腹いっぱい。 [sage] 2025/08/01(金) 18:30:40.03 ID:2SdW+XUv0 論文雑誌の画像スキャンOCR例がありましたので何かの参考までに https://www.jstage.jst.go.jp/article/jjsai/27/1/27_67/_article/-char/ja SumatraPDFですが 段組み内の改行跨ぎ検索は大丈夫、例「新聞やテレビ」 段組み跨ぎやページ跨ぎはダメでした、例「リアルタイム」 OCR処理ではなく画像処理の問題ですが、スキャン画像の傾きが補正されていて 画像は白黒ディザリングでサイズダウンしている様です http://egg.5ch.net/test/read.cgi/software/1711002779/648
649: 名無しさん@お腹いっぱい。 [] 2025/08/02(土) 06:49:17.77 ID:9+Bx6sl60 官報でやってみた 埋め込みPDF https://github.com/lithium0003/pdf_addtext/raw/main/Sample/20250718g00165full00010088.processed.pdf オリジナル https://github.com/lithium0003/pdf_addtext/raw/main/Sample/20250718g00165full00010088.pdf 13ページくらいから、条約の原文が画像で貼ってあるのをテキスト検索できるようになった、と思う。 あとは、どういう感じで画像を抽出しつつOCRして戻すのをやるかを考え中。 自分で遊びたい人は、ソースはこれ https://github.com/lithium0003/pdf_addtext C++でコンパイルする必要があるけど http://egg.5ch.net/test/read.cgi/software/1711002779/649
650: 名無しさん@お腹いっぱい。 [sage] 2025/08/02(土) 16:51:20.82 ID:H4rP2k+Q0 官報のレイアウト難易度凄いですね(縦書き横書き、回転文書画像など) しかも縦書きTrue PDF部分ではクリップボードコピーしたら一文字毎に改行されてました (改行を取った状態『「第六十条第三項第一号」に改め、「規定による」を削り』などで検索は出来ますが) これはもう対応しなくて良いと思いますが、OCR部分で気が付いたのがP25の点線囲いの部分が誤認識してる様です 4 第一項及び第二項の規定による立入検査の権限は、犯 罪捜一査のためにーー認ーめーーられーーたーものーーとー解釈してーーーーーーーーはーならない。ーーーー 第百六条次の各号ーのいずれかに該当するときーはー、そ」の違 反行為をした者は、三十万円以下の罰金に処する。 一〜七(略) 八 第七十二条の二第一項又は第二項の規定に違反し て、報告をせず、若しくは虚偽の報告をし、又はこれ らの規定による検査を拒み、若しくは妨げたとき。 ー ーー http://egg.5ch.net/test/read.cgi/software/1711002779/650
651: 名無しさん@お腹いっぱい。 [] 2025/08/02(土) 17:11:04.77 ID:9+Bx6sl60 >>650 そこの点線は誤認識してますね。 一応点線っぽいところは自動で外すロジックになってるのですが、文字に近接しすぎているので場所的に ふりがな扱いの伸ばし棒と誤認されて拾ってしまってますね。 これはもう無理ゲー 前処理で、罫線を見つける処理を走らせてマスクする必要がありそう。 http://egg.5ch.net/test/read.cgi/software/1711002779/651
652: 650 [sage] 2025/08/02(土) 18:46:20.53 ID:vzahj3Pe0 >>651 ですよね、どんなシステムで文書作成してるのか逆に気になります >>650の「一文字毎に改行され」がSumatraPDFのせいなのかと思い、 観念してAdobe Acrobat Reader DCをインストールした所、その通りでした(64bit version 25.001.20577) 官報のTruePDF縦書きクリップボードコピーも「一文字毎に改行」はされなくて連続してコピーされ さらにIMG_2399.pdfの「婆さん」の行跨ぎ検索も出来てます 縦書き文字列のマウス選択操作もSumatraよりも断然正確でした (行が傾いていてもその傾き通りに選択状態になる) http://egg.5ch.net/test/read.cgi/software/1711002779/652
653: 名無しさん@お腹いっぱい。 [sage] 2025/08/03(日) 12:00:05.05 ID:pu/nbpro0 ScanSnap用のScanSnap OrganizerやScanSnap HomeのOCRエンジンはABBYY製だと言われているので、 製品版ABBYY 15を高い金を出して買ってみたのだが、OCR精度(縦書き日本語)はScanSnap用よりも悪いし、 画像を変えずにPDFにOCR埋め込みはできないし、他のソフトでPDFに埋め込んだOCR透明テキストは編集できないし、 OCR後のリフローテキスト出力は段落認識の精度が悪いし、といった具合で、金をドブに捨てた感じ http://egg.5ch.net/test/read.cgi/software/1711002779/653
654: 名無しさん@お腹いっぱい。 [sage] 2025/08/04(月) 08:03:12.76 ID:WQjkdvzc0 PCをリカバリーしたら自分がScanSnapを買った時付いていたPower PDF Standardの認証ができなくなっていた ベンダーが変わったからそんなこともあろうかと事前に調べてテストしておいたのだがライセンスは HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Licenses に保存されているのでそれをregファイルにエクスポートしておいてインストール後実行前に開けばよろし それにしても無責任なことだな Power PDF StandardはScanSnap Orgaizer/HomeよりもOCRの精度が高い(日本語縦書) 欠点は既にOCR透明テキストが存在していても消してくれずOCRが二重になってしまうこと http://egg.5ch.net/test/read.cgi/software/1711002779/654
655: 名無しさん@お腹いっぱい。 [sage] 2025/08/04(月) 08:30:40.14 ID:WQjkdvzc0 その後気付いたのだがこういうページがあった https://faq.pfu.jp/faq/show/4835 でもregファイルで保存しておく方が認証を気にせずに済み、何台でもインストールできて(そんなことはしないけど)いいと思う http://egg.5ch.net/test/read.cgi/software/1711002779/655
656: 名無しさん@お腹いっぱい。 [] 2025/08/23(土) 10:27:18.08 ID:KJ5R94RS0 bunkoOCRのiOS版を更新しました。審査通ればそのうち配信されると思います。 OCRの結果をpdf出力で透明検索可能テキストとして埋め込めるようにしました。 pdfの画像ページを取り込んで、画像と文字ページをそのままにして、 透明検索可能テキストを埋め込めるようにしました。 Transformerの部分を修正して、画像が粗くて認識失敗したときに文字ズレが起こりにくくしました。 官報みたいに90度くるくる回っている画像の為に、回転オプションをつけました。 国会図書館デジタルコレクションのpdfの下部80pixelのところに文字が入れられて邪魔なので、 上下左右をトリミングできるようにしました。 ロジックは出来たので、このバージョンをWindows版にも反映させます。 もうしばらくお待ちください。 http://egg.5ch.net/test/read.cgi/software/1711002779/656
657: 名無しさん@お腹いっぱい。 [] 2025/08/24(日) 06:35:22.44 ID:g82KMW5B0 Window楽しみに待ってます http://egg.5ch.net/test/read.cgi/software/1711002779/657
658: 名無しさん@お腹いっぱい。 [sage] 2025/08/25(月) 22:11:33.54 ID:OvfEPKki0 お疲れ様です ずっと待っていました トリミング機能追加ありがとうございます http://egg.5ch.net/test/read.cgi/software/1711002779/658
659: 名無しさん@お腹いっぱい。 [sage] 2025/09/01(月) 23:04:59.55 ID:1rqD0I8v0 Windows版bunkoOCRのおかげで絶版文庫本を非破壊で電子化できたー、ありがとうございます http://egg.5ch.net/test/read.cgi/software/1711002779/659
660: 名無しさん@お腹いっぱい。 [sage] 2025/09/06(土) 20:13:56.97 ID:H8EgYyo00 スキャンした住民票をテキスト化するんでアプリ探してたんだが 数十ページ分とかでなければ OS付属のSnipping Toolで十分だなこりゃ そこそこ画数の多い漢字も正確に変換してくれた 今のところ誤字変換も無さそう http://egg.5ch.net/test/read.cgi/software/1711002779/660
661: 名無しさん@お腹いっぱい。 [sage] 2025/09/06(土) 20:24:53.44 ID:H8EgYyo00 OneNoteのテキスト抽出は操作が分かりやすいが Snipping Toolと比べると誤認識が多くてまあまあ直しが必要 http://egg.5ch.net/test/read.cgi/software/1711002779/661
662: 名無しさん@お腹いっぱい。 [sage] 2025/09/09(火) 23:58:11.75 ID:01QOxF3K0 >>660 Windows10のやつだとOCR機能が無かった http://egg.5ch.net/test/read.cgi/software/1711002779/662
663: 名無しさん@お腹いっぱい。 [] 2025/09/10(水) 15:21:45.55 ID:FaVREnhG0 11からの機能だったはず http://egg.5ch.net/test/read.cgi/software/1711002779/663
664: 代行 [sage] 2025/09/14(日) 08:47:38.72 ID:E2z5dYHq0 外部ツールを使えばWindows10でもOCR使えるはず http://egg.5ch.net/test/read.cgi/software/1711002779/664
665: 名無しさん@お腹いっぱい。 [sage] 2025/09/22(月) 20:57:38.33 ID:gwiq/oAq0 bunkoOCRなんだけど 本文中に《 》で囲まれた文字がルビ扱いになるね 漢字《本文》 や 《|本文《ルビ》》 みたいの 【 】などに置き換えてるけど青空文庫の仕様だから仕方ないのかな 文字認識としては正しいのに http://egg.5ch.net/test/read.cgi/software/1711002779/665
666: 名無しさん@お腹いっぱい。 [] 2025/09/23(火) 03:22:27.09 ID:tALN4ZQg0 内部的には0xFFF9-0xFFFBを使っているのですが、対応している環境が皆無なので 適当なフォーマットに変換してます。《 》じゃない文字でも出力できる必要がありますね。 ラノベだとわりと被るから http://egg.5ch.net/test/read.cgi/software/1711002779/666
667: 名無しさん@お腹いっぱい。 [sage] 2025/10/03(金) 14:01:06.48 ID:IYjy8lx+0 青空文庫のフォーマット考えたやつバカだよな http://egg.5ch.net/test/read.cgi/software/1711002779/667
668: 名無しさん@お腹いっぱい。 [] 2025/10/03(金) 14:11:13.88 ID:kWlG0hPv0 >>667 SJIS しか使えない機材が多数だった時代に 特別なツール無しでそれこそワープロ専用機でも本を読み書きできることを目標に決められたフォーマットなんで足りないのは仕方ない 過去の遺物、epub とか使え http://egg.5ch.net/test/read.cgi/software/1711002779/668
669: 名無しさん@お腹いっぱい。 [] 2025/10/03(金) 23:39:12.47 ID:VUABJA2R0 縦書きのePubとか止めてくれ http://egg.5ch.net/test/read.cgi/software/1711002779/669
670: 名無しさん@お腹いっぱい。 [] 2025/10/04(土) 10:46:48.40 ID:YYSU4Zh/0 >>669 なんで? 便利じゃん http://egg.5ch.net/test/read.cgi/software/1711002779/670
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.017s