全文検索エンジン Hyper Estraier 2 (333レス)
全文検索エンジン Hyper Estraier 2 http://mevius.5ch.net/test/read.cgi/unix/1176807372/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
178: 名無しさん@お腹いっぱい。 [sage] 2009/02/01(日) 02:03:25 >>47にも書いてるけど,属性検索ができない. Wikipediaの全文検索デモページで試してみたけど効果なし... http://mevius.5ch.net/test/read.cgi/unix/1176807372/178
179: 名無しさん@お腹いっぱい。 [sage] 2009/02/08(日) 23:47:35 疑似ノードマスタって、認証なしなの? 通常のノードマスタみたいにユーザとパスを設定できないの? http://mevius.5ch.net/test/read.cgi/unix/1176807372/179
180: 名無しさん@お腹いっぱい。 [sage] 2009/02/09(月) 01:33:22 estcmd outで文書の一括削除はできますか? http://mevius.5ch.net/test/read.cgi/unix/1176807372/180
181: 名無しさん@お腹いっぱい。 [] 2009/02/13(金) 23:47:32 Windows版のバイナリ落としてindexだけはコマンドで作ってみたんですが JavaのAPI使ってファイル検索や全文検索を行うサンプルコードが載って いるサイトとかってないですかね? web環境ないのでSwingから直で操作したいのですがAPIの使い方がよくわかりません・・ 初歩的な質問ですいません。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/181
182: 名無しさん@お腹いっぱい。 [sage] 2009/02/23(月) 06:47:28 Unix板なのに申し訳ないのですが、Ubuntu Intrepid64bit版を使っています。 mecabを組み込みたかったのでソースからビルドしましたが、ライブラリとしてregexp.hだけ認識されないのでビルドできません。 32bitの時も同様だったのですが、こちらはネットでダウンロードしたライブラリをつっこんでインストール迄無事に成功しました。 aptitude search lib | grep -i regexp などで見つけたものを次々インストールしてみましたが全くお手上げです。 必要なライブラリについてご存知の
方いませんか? http://mevius.5ch.net/test/read.cgi/unix/1176807372/182
183: 名無しさん@お腹いっぱい。 [sage] 2009/02/23(月) 09:04:47 >>182 やったの去年だからよく覚えてないけど ふつーのUbuntuならソフトウェアの一覧に普通に入っていた気がする http://mevius.5ch.net/test/read.cgi/unix/1176807372/183
184: 名無しさん@お腹いっぱい。 [sage] 2009/02/23(月) 17:49:55 aptで入るね http://mevius.5ch.net/test/read.cgi/unix/1176807372/184
185: 182 [sage] 2009/02/24(火) 06:22:35 >>183-184 レス有難うございます、結局手順を忘れていただけで、32bit版でと同様の事をすればいいだけですんなりビルド成功。 aptでlibc-dev(これですよね?)を入れてもlibregex.aがないので、http://arglist.com/regex/からregex3.8a.tar.gzを落してビルドし~/lib ~/includeに放り込む。 似たような事で困っている方は試してみて下さい。 どうもお騒がせしました。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/185
186: 名無しさん@お腹いっぱい。 [sage] 2009/08/28(金) 12:40:08 作者ページのタイトルがうざくなってるんだが、改ざんされたのかな http://mevius.5ch.net/test/read.cgi/unix/1176807372/186
187: 名無しさん@お腹いっぱい。 [sage] 2009/08/28(金) 13:43:19 特に変わったようには見えないが。 > Last-Modified: Tue, 25 Dec 2007 01:47:27 GMT だし。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/187
188: 名無しさん@お腹いっぱい。 [sage] 2009/08/28(金) 20:25:53 >>186 ソースみてみ。アクセスしたタイミングで表示されるものが変わるようになってる。 しかし作者タソはmixiに就職してからH.E.のほうには全然顔出さなくなったな。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/188
189: 名無しさん@お腹いっぱい。 [sage] 2009/08/28(金) 22:37:54 ソース見てみた、何じゃこりゃ。 > case 59: name = "ちょwwwおまwwwいごww"; break; > case 61: name = "どう見ても超迷子です本当にありがとうございました"; break; http://mevius.5ch.net/test/read.cgi/unix/1176807372/189
190: 名無しさん@お腹いっぱい。 [sage] 2009/08/31(月) 10:17:50 > From: [783] 名無しさん@お腹いっぱい。 <sage> > Date: 2006/09/17(日) 07:52:41 > > case 59: name = "ちょwwwおまwwwいごww"; break; > case 61: name = "どう見ても超迷子です本当にありがとうございました"; break; http://mevius.5ch.net/test/read.cgi/unix/1176807372/190
191: 名無しさん@お腹いっぱい。 [sage] 2009/11/09(月) 16:22:46 検索してもHitしないってことはなにが考えられるのかな? 登録文書に検索語句は確実にあるし、DBも壊れていない・・・ http://mevius.5ch.net/test/read.cgi/unix/1176807372/191
192: 名無しさん@お腹いっぱい。 [sage] 2009/11/09(月) 18:02:45 ごめん、壊れてたみたい。 estcmd inform で壊れてるかどうかわかんないんだよなあ・・・ http://mevius.5ch.net/test/read.cgi/unix/1176807372/192
193: 名無しさん@お腹いっぱい。 [sage] 2009/11/15(日) 00:49:32 >>192 そうなの?おれもestcmd inform で情報出てきたら平気だと思ってた。 どうやって壊れてる判定したの? http://mevius.5ch.net/test/read.cgi/unix/1176807372/193
194: 名無しさん@お腹いっぱい。 [sage] 2009/11/15(日) 01:54:04 >>193 絶対に登録文書にある文字列を検索しても出てこなかったので。 再構築で直りました。 インデックスが壊れているかどうか調べるコマンドが欲しい。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/194
195: 名無しさん@お腹いっぱい。 [sage] 2009/11/18(水) 06:15:41 estcmd repair を、時々やらないと駄目ってことですかね。 (-_-;ウーン たまに治らないときもあるし.. -- 追記お願いします m(_ _"m)ペコリ--------- 【テク1】ノードマスタが再起動しない・・正常に停止しないとこうなる サーバールートDirの _pid _stop の削除 【テク2】DBが?でるっぽい #estcmd repair index_path ex.ノードサーバー利用時は(サーバールートをcasketなら) #estcmd repair casket/_node/ノード名 【テク3】estwaver crawl時の「could not open」
エラーの解決法 クローラールートディレクトリを crawl_dir と仮定して Code: #cd crawl_dir #estcmd repair _index #dpmgr repair _trace/0001/depot #dpmgr repair _trace/0002/depot #dpmgr repair _trace/0003/depot http://mevius.5ch.net/test/read.cgi/unix/1176807372/195
196: 名無しさん@お腹いっぱい。 [sage] 2009/11/18(水) 16:56:39 >>195 >>estcmd repair を、時々やらないと駄目ってことですかね。 repairを一回やってみたんだ。直ったかなと思って、それでも念の為に もう一回repairしてみたんだ。登録文書がごっそり減ったんだ。 repairを繰り返す度に減っていくんだ・・・ あきらめて再構築したよ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/196
197: 名無しさん@お腹いっぱい。 [sage] 2009/11/19(木) 05:41:03 >repairを繰り返す度に減っていくんだ・・・ ((( ;゚Д゚)))ガクガクブルブル 「特定のキーワードにヒットしたを、DBから削除する」 なんてことできますか? 「特定のキーワードにヒットさせない」でもいいかなー http://mevius.5ch.net/test/read.cgi/unix/1176807372/197
198: 名無しさん@お腹いっぱい。 [sage] 2009/11/20(金) 08:54:17 Estraierで2chのログファイルを全文検索してJaneで表示できないでしょうか。 DATファイルを全文検索に入れるだけじゃなくて、名前やスレタイで絞り込めれば最高なのですが。 DesktopHEで利用しようとしております。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/198
199: 名無しさん@お腹いっぱい。 [sage] 2009/11/20(金) 14:16:19 >>197 私も探してみたけど、そのものは無いみたい。 よくやる作業ならcgiとか作るんじゃないかな。 コマンドから手作業するときは、例えばこんな感じ。 消したいやつを検索して estcmd search -vu -attr '@uri STRINC /path/to/del/' _index BadWord OKなら上のコマンドに以下を追加 |awk '$1 ~ /^[0-9]+/{print $1}' |while read id; do estcmd out -cl _index $id; done http://mevius.5ch.net/test/read.cgi/unix/1176807372/199
200: 名無しさん@お腹いっぱい。 [sage] 2009/11/20(金) 16:26:25 >>198 出来ないことはないと思うけど、面倒くさいかもね。dat2htmlのフィルタ作って読みこませて、 DesktopHEの関連付けはjaneにすればいいみたいな。 私はhtmlに変換してブラウザで全文検索してる。そういう人の方が多いと思うけど。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/200
201: 名無しさん@お腹いっぱい。 [sage] 2009/11/20(金) 22:49:29 >>200 速レスありがとう。 htmlに変換してって毎日巡回するたびにdat2html走らせてるの? それとも真夜中にバッチ処理? いずれにせよ、HDD容量が倍必要ですよね? http://mevius.5ch.net/test/read.cgi/unix/1176807372/201
202: 名無しさん@お腹いっぱい。 [sage] 2009/11/21(土) 12:31:28 >>201 >>毎日巡回するたびにdat2html走らせてるの? そうだよ。1時間ごとにdat2htmlを走らせてる。ロードアベレージを見て負荷が大きいときは処理しないようにしている。 ログは8GBくらいある。datファイルは定期的に削除している。 ウェブブラウザから検索できるので、LAN内で利用出来て重宝している。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/202
203: 名無しさん@お腹いっぱい。 [sage] 2009/11/21(土) 23:28:31 >>202 うちもログは6Gぐらいあります。 全部変換するとなると15gぐらいいきそうですよねorz Windowsだからロードアベレージ監視できないのと、指定したコテハンがNASDAQについて レスした発言とかを知りたくても特定がとてつもなく難しいのがネックになりそう。 Threadsearchと併用しないと駄目ですかね。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/203
204: 名無しさん@お腹いっぱい。 [sage] 2009/11/27(金) 00:40:30 XREAで設置しようとしたけど、インストールの段階で躓いたorz cannot find -liconvとかでてきてるし・・・ libiconvの入れ方に問題があるのかなぁ・・・。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/204
205: 名無しさん@お腹いっぱい。 [] 2010/01/07(木) 21:28:29 某サイト丸ごと吸い上げようと、 クローラーの設定seeddepthを50にしたら、5時間かかっても1つもインデックスできなかった... 種文書を全部吸い上げてからインデックスするとは知らんかった。 seeddepth1〜2でよさそうね。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/205
206: 名無しさん@お腹いっぱい。 [sage] 2010/01/15(金) 16:12:43 Hyper Estraier のwinを使っている方に質問です。 当方初心者。 インストール、インデックス作成まではできました。なんとか。 しかし、estseek.confの内容変更の段で(だと思ってるんですが・・・)つまづいています。 replaceの行の変更はどのようにしたらよろしいのか教えていただけないでしょうか? 何卒よろしくお願いいたします。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/206
207: 名無しさん@お腹いっぱい。 [sage] 2010/01/16(土) 02:43:00 >>206 win版も使ったことはありますが、それだけでは何がなんだか分かりません。 estcmd inform casket は通りますか? Hyper Estraier の画面は出るのですか? 表示のどこかに不満があるのですか? どうなって欲しくて、現状どうなっているのか書いてください。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/207
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 126 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.018s