全文検索エンジン Hyper Estraier 2 (333レス)
上下前次1-新
195(1): 2009/11/18(水)06:15 AAS
 estcmd repair を、時々やらないと駄目ってことですかね。 
 (-_-;ウーン たまに治らないときもあるし.. 
  
 -- 追記お願いします m(_ _"m)ペコリ--------- 
 【テク1】ノードマスタが再起動しない・・正常に停止しないとこうなる 
  サーバールートDirの _pid _stop の削除 
  
 【テク2】DBが?でるっぽい 
 #estcmd repair index_path 
  
  ex.ノードサーバー利用時は(サーバールートをcasketなら) 
 #estcmd repair casket/_node/ノード名 
  
 【テク3】estwaver crawl時の「could not open」エラーの解決法
省6
196: 2009/11/18(水)16:56 AAS
 >>195 
 >>estcmd repair を、時々やらないと駄目ってことですかね。 
 repairを一回やってみたんだ。直ったかなと思って、それでも念の為に 
 もう一回repairしてみたんだ。登録文書がごっそり減ったんだ。 
 repairを繰り返す度に減っていくんだ・・・ 
  
 あきらめて再構築したよ。
197(1): 2009/11/19(木)05:41 AAS
 >repairを繰り返す度に減っていくんだ・・・  
  
 ((( ;゚Д゚)))ガクガクブルブル  
  
 「特定のキーワードにヒットしたを、DBから削除する」 なんてことできますか? 
  
 「特定のキーワードにヒットさせない」でもいいかなー 
198(2): 2009/11/20(金)08:54 AAS
 Estraierで2chのログファイルを全文検索してJaneで表示できないでしょうか。 
 DATファイルを全文検索に入れるだけじゃなくて、名前やスレタイで絞り込めれば最高なのですが。 
  
 DesktopHEで利用しようとしております。 
199: 2009/11/20(金)14:16 AAS
 >>197 
 私も探してみたけど、そのものは無いみたい。 
 よくやる作業ならcgiとか作るんじゃないかな。 
  
 コマンドから手作業するときは、例えばこんな感じ。 
 消したいやつを検索して 
 estcmd search -vu -attr '@uri STRINC /path/to/del/' _index BadWord 
 OKなら上のコマンドに以下を追加 
 |awk '$1 ~ /^[0-9]+/{print $1}' |while read id; do estcmd out -cl _index $id; done 
200(1): 2009/11/20(金)16:26 AAS
 >>198 
 出来ないことはないと思うけど、面倒くさいかもね。dat2htmlのフィルタ作って読みこませて、 
 DesktopHEの関連付けはjaneにすればいいみたいな。 
  
 私はhtmlに変換してブラウザで全文検索してる。そういう人の方が多いと思うけど。
201(1): 2009/11/20(金)22:49 AAS
 >>200 
 速レスありがとう。 
 htmlに変換してって毎日巡回するたびにdat2html走らせてるの? 
 それとも真夜中にバッチ処理? 
  
 いずれにせよ、HDD容量が倍必要ですよね? 
202(1): 2009/11/21(土)12:31 AAS
 >>201 
 >>毎日巡回するたびにdat2html走らせてるの? 
 そうだよ。1時間ごとにdat2htmlを走らせてる。ロードアベレージを見て負荷が大きいときは処理しないようにしている。 
 ログは8GBくらいある。datファイルは定期的に削除している。 
 ウェブブラウザから検索できるので、LAN内で利用出来て重宝している。
203: 2009/11/21(土)23:28 AAS
 >>202 
 うちもログは6Gぐらいあります。 
 全部変換するとなると15gぐらいいきそうですよねorz 
  
 Windowsだからロードアベレージ監視できないのと、指定したコテハンがNASDAQについて 
 レスした発言とかを知りたくても特定がとてつもなく難しいのがネックになりそう。 
  
 Threadsearchと併用しないと駄目ですかね。 
204: 2009/11/27(金)00:40 AAS
 XREAで設置しようとしたけど、インストールの段階で躓いたorz 
  cannot find -liconvとかでてきてるし・・・ 
  
 libiconvの入れ方に問題があるのかなぁ・・・。 
205: 2010/01/07(木)21:28 AAS
 某サイト丸ごと吸い上げようと、 
 クローラーの設定seeddepthを50にしたら、5時間かかっても1つもインデックスできなかった... 
  
 種文書を全部吸い上げてからインデックスするとは知らんかった。 
 seeddepth1〜2でよさそうね。 
206(1): 2010/01/15(金)16:12 AAS
 Hyper Estraier のwinを使っている方に質問です。 
  
 当方初心者。 
 インストール、インデックス作成まではできました。なんとか。 
  
 しかし、estseek.confの内容変更の段で(だと思ってるんですが・・・)つまづいています。 
 replaceの行の変更はどのようにしたらよろしいのか教えていただけないでしょうか? 
  
 何卒よろしくお願いいたします。 
207: 2010/01/16(土)02:43 AAS
 >>206 
 win版も使ったことはありますが、それだけでは何がなんだか分かりません。 
 estcmd inform casket は通りますか? 
 Hyper Estraier の画面は出るのですか? 
 表示のどこかに不満があるのですか? 
 どうなって欲しくて、現状どうなっているのか書いてください。 
208: 2010/01/18(月)15:45 AAS
 ゴミのような2chのログも、こいつを使うと宝の山になる。 
 はらしょー 
209(1): 2010/02/05(金)14:01 AAS
 Hyper Estraier 1.4.10(Win)を利用している者です。 
  
 ブラウザの検索結果画面のリンクをクリックしてもジャンプしないという経験をした方はいないでしょうか? 
 今、その状態です。 
  
 検索結果画面のソースを丸々コピーしたhtmlファイルを作成し、それをブラウザに表示し、リンクをクリックすれば目的の文書にジャンプします。 
 すごく不思議な感じです。ブラウザはIE、sleipnirで確認しました。 
  
 どのようにすればジャンプするようになるかおわかりの方、教えていただけないでしょうか? 
 これは、もうhtmlの問題に過ぎないような気もしますが、よろしくお願いいたします。 
210(1): 2010/02/05(金)22:04 AAS
 文字コードの問題じゃね? 
211(1): 2010/02/07(日)17:19 AAS
 鯖、HEてよりは、ブラウザ、クライアントの問題ぽく聞こえる。 
212: 209 2010/02/08(月)08:11 AAS
 >>211 
 ブラウザは、他にオペラも試しました。同じ結果でした。 
 クライアントも4人分のLAN接続しているPCから試しました。同じ結果でした。 
  
 >>210 
 仮に文字コードの問題なら、対処法はありますでしょうか? 
  
 何卒よろしくお願いいたします。 
213(1): 2010/02/08(月)20:12 AAS
 まずは、本当に文字コードの問題かどうかを確かめるべきです 
 フォルダ名からファイル名まで完全に英数文字だけのファイルをわざと検索結果として出して 
 それをブラウザから開くことができれば、文字コードの問題だと思います 
214: 209,212 2010/02/09(火)08:13 AAS
 >>213 
 >フォルダ名からファイル名まで完全に英数文字だけのファイルをわざと検索結果として出し 
  
 やってみました。ダメでした。相変わらずジャンプしてくれません。 
  
 考えるに、estseek.conf の replace設定なのかな、と。 
 これについては、自分でも自信がなかったので、下記に示します。 
 当方の場合、c:\の直下に「server」のフォルダを作成し、そこに「estseek.cgi」、「casket」等を入れております。 
  
 −−−−−−−−−−−−−−−−−−−−−−−−−−− 
 replace: ^file:///c:\server\{{!}}外部リンク:127.0.0.1 
 replace: /index\.html?${{!}}/ 
 −−−−−−−−−−−−−−−−−−−−−−−−−−−
省1
215: 209,212,214 2010/02/09(火)16:47 AAS
 追記します。 
  
 estseek.conf のreplace設定を見直してみました。 
 試行錯誤の結果、 
 −−−−−−−−−−−−−−−−−−−−−−−−−−− 
 replace: file:///c|/server/{{!}}http://サーバPCのIPアドレス/ 
 replace: /index\.html?${{!}}/ 
 −−−−−−−−−−−−−−−−−−−−−−−−−−− 
 とすることによりまして、 
 検索結果の画面に緑色で表示される、ヒットした文書ファイルの所在の表示が、 
  
 http://サーバPCのIPアドレス/|http://サーバPCのIPアドレス/・・・・・
省3
216(1): 2010/02/09(火)20:47 AAS
 replaceの設定は元の設定で問題ない感じがします。 
  
 むしろ、showlrealの設定が falseの設定になっていると、 
 当該現象が発生するように思われます。こちらでも、 
 同様の現象を確認しました。unix で 1.4.13ですが。
217(1): 2010/02/09(火)21:38 AAS
 こちらでは、ジャンプしない現象も、その後に改善した状況も確認できました。 
  
 replace行を拝見すると、C:\server\ 部分のエスケープがされてないようです。 
 正しくは、C:\\server\\ではないでしょうか?  
  
 そして、C:\\server\\の配下に、実際の検索したいデータが存在する必要があります。estseek.cgiや indexファイルではありません。 
  
 showlrealの変更で、ジャンプの可否が確認できたら、この行を修正する必要があります。 
  
 以下マニュアルより 
 ------------- 
 replaceは正規表現によってURIを変換するのに使います。複数回指定できます。 
 先頭にマッチする「^」を駆使すれば接頭辞(ディレクトリ)の変換ができますし、末尾にマッチする
省3
218: 209,212,214,215 2010/02/10(水)07:57 AAS
 >>216 
 showlreal を「true」にしてみましたが、状況は変わりませんでした。 
 ジャンプする、しないの問題でいえば、pdfの文書ファイルはジャンプすることが確認されました。 
 .htmがなぜかジャンプしないのです。 
  
 >>217 
 C:\\server\\と記載し、やってみました。 
 すると、検索結果の画面に緑色で表示される、ヒットした文書ファイルの所在の表示が、 
 c:\server\search\・・・・・ 
 となりました。 
  
 htmの文書へは、ジャンプしてくれません。
省3
219: 2010/02/10(水)08:56 AAS
 つーかさ、やってることの意味分かってやってる? 
 別に「そうしないと君のためにならないよ」なんてくだらない説教をしたいからではなく、 
 何が分かって何が分からなかったのかを言ってくれないと、どこから説明すればいいのか、 
 どこを質問すればいいのかを、こっちは全部エスパーしなくちゃならないんだよ。 
 困ってるのは分かってるから、せめて情報の出し惜しみはしないでくれ。 
  
 # 素直に読むと、何も分かってない、replace行の動作の意味や正規表現とはなんぞやを 
 # すべて説明しなくちゃならないように思えるんだけど..... もしかしてそうなの?
220: 2010/02/23(火)20:50 AAS
 これって英語の検索もはやくなるの? 
221: 2010/02/24(水)00:09 AAS
 もちろん早くなるけど、普通に使うと hyper で hyper estraier には引っかかるけど、hyperestraier には引っかかりません 
 そういうのを引っかけるようにするにはワイルドカードを使うなど工夫しなくてはなりません 
222: 2010/02/24(水)12:18 AAS
 外部リンク:www.seg.rmit.edu.au 
 英語で使うだけならこっちの方が速かったりする? 
223: 2010/02/24(水)12:50 AAS
 なんだ、宣伝かよ 
224: 2010/02/24(水)16:57 AAS
 日本語で最速なのはこれっぽいけど 
 英語で最速なのがどれなにか知りたかったんだ 
上下前次1-新書関写板覧索設栞歴
あと 109 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.021s