全文検索エンジン Hyper Estraier 2 (333レス)
上下前次1-新
141(1): 2008/07/25(金)15:21 AAS
 >>139 
  
 うぅ、バカに救いの手をありがとうございます。orz 
 少しインデックス化できた文章が増えたので、イケルか!と思ったんですが、 
 値を倍位に変更しても、それ以上は増えなくて、やっぱり途中で切れちゃってる。_| ̄|○||| 
 ( -t 10 => 500とかもしてみたけどダメだった…) 
  
 なにげに、 
 $ pdftotext -enc UTF-8 -htmlmeta "pdfファイル" 
 これでやってみると、きちんとオワリまで文章がテキスト化されているみたい。 
  
 新たに発覚したんだけど、どうもpdf文章の途中でたまたま出てくる「<<」の記号から、 
 「>>」の所まで、ごっそり文書がインデックス化されてないっぽい。(゚ロ゚;))((;゚ロ゚)オロオロ
省2
上下前次1-新書関写板覧索設栞歴
あと 192 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.013s