全文検索エンジン Hyper Estraier 2 (333レス)
上
下
前
次
1-
新
141
(1)
: 2008/07/25(金)15:21
AA×
>>139
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
141: [] 2008/07/25(金) 15:21:53 >>139 うぅ、バカに救いの手をありがとうございます。orz 少しインデックス化できた文章が増えたので、イケルか!と思ったんですが、 値を倍位に変更しても、それ以上は増えなくて、やっぱり途中で切れちゃってる。_| ̄|○||| ( -t 10 => 500とかもしてみたけどダメだった…) なにげに、 $ pdftotext -enc UTF-8 -htmlmeta "pdfファイル" これでやってみると、きちんとオワリまで文章がテキスト化されているみたい。 新たに発覚したんだけど、どうもpdf文章の途中でたまたま出てくる「<<」の記号から、 「>>」の所まで、ごっそり文書がインデックス化されてないっぽい。(゚ロ゚;))((;゚ロ゚)オロオロ すまん、かえって混乱させてるかも。。 というか、自分混乱してる。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/141
うぅバカに救いの手をありがとうございます 少しインデックス化できた文章が増えたのでイケルか!と思ったんですが 値を倍位に変更してもそれ以上は増えなくてやっぱり途中で切れちゃってる とかもしてみたけどダメだった なにげに ファイル これでやってみるときちんとオワリまで文章がテキスト化されているみたい 新たに発覚したんだけどどうも文章の途中でたまたま出てくるの記号から の所までごっそり文書がインデックス化されてないっぽい すまんかえって混乱させてるかも というか自分混乱してる
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 192 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
ぬこの手
ぬこTOP
0.019s