全文検索エンジン Hyper Estraier 2 (333レス)
全文検索エンジン Hyper Estraier 2 http://mevius.5ch.net/test/read.cgi/unix/1176807372/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
265: 名無しさん@お腹いっぱい。 [sage] 2010/09/23(木) 01:38:18 >>264 mixiの全データ検索に使用されているからそれはないのでは? なにか運用間違えているとか? http://mevius.5ch.net/test/read.cgi/unix/1176807372/265
266: 名無しさん@お腹いっぱい。 [sage] 2010/09/23(木) 02:49:10 TCの全文検索ってQ-GRAMインデックスのことだろ? データ量増えるとホント糞みたいに重くなって使い物にならんぞ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/266
267: 名無しさん@お腹いっぱい。 [sage] 2010/09/23(木) 19:36:40 作ってる本人も遅いって言ってた気がする。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/267
268: 265 [sage] 2010/09/23(木) 20:30:00 mixiでTCが使われているのは全文検索じゃなかったね。ゴメン http://mevius.5ch.net/test/read.cgi/unix/1176807372/268
269: 名無しさん@お腹いっぱい。 [sage] 2010/10/07(木) 04:14:16 >>263 N-gramのN=2とかが関係してるんじゃない? わかち書きを変えてみると違う結果になると思う。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/269
270: 名無しさん@お腹いっぱい。 [sage] 2010/10/09(土) 17:47:15 >>269 レス、ありがとうございました。 とりあえず、est_cond_set_optionsのオプションをESTCONDSUREで 検索してみましたが、結果の数は変わりませんでした。 なんにしろ、N-gram関連を勉強してみます。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/270
271: 名無しさん@お腹いっぱい。 [sage] 2010/10/11(月) 12:23:08 >>263 wildmax の設定でいくらか調整できると思う。 けれど一文字で検索する場合には、N-gramインデックスでは あまり良い結果出せないんじゃないかな。 269が書いた通り、2-gramに対し一文字で検索するため、 「ab」を含む文書を取得する 「a」で始まる2-gramをwildmax個拾って、それらを含む文書を 取得する(2gramの出現頻度とかは見てない) という内部動作なんだろうなと、前に思った。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/271
272: 名無しさん@お腹いっぱい。 [sage] 2010/10/27(水) 20:48:38 >>271 遅レスすいません。さっき、気づきました。 詳細な情報ありがとうございました。 とりあえず、ソースを読んでみましたが、 QDBMの中身も把握してないと理解 できなさそうなので、時間のあるときに 見てみます。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/272
273: 名無しさん@お腹いっぱい。 [sage] 2010/10/30(土) 15:19:33 誰かこの問題をHyper Estraier でも起きないか検証してくれw ttp://uinyan.com/windows7_critical_bug/ http://mevius.5ch.net/test/read.cgi/unix/1176807372/273
274: 名無しさん@お腹いっぱい。 [sage] 2010/11/16(火) 15:09:15 windowsですが、DesktopHEの他に、似たソフトってないですか? もしくはどなたか改造されていたり。 フォルダ順ができるだけでも楽になるのですが・・・ http://mevius.5ch.net/test/read.cgi/unix/1176807372/274
275: 名無しさん@お腹いっぱい。 [sage] 2011/02/10(木) 08:37:50 ファイル名のみ、または、最初の数行だけをクロールすることは可能? 全文だとインデックスがすごい容量になりそうなので、できるだけ少ないクロールをしたいのですが。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/275
276: 名無しさん@お腹いっぱい。 [sage] 2011/02/10(木) 09:36:59 ”インデックスの容量”を心配しているの? だとしたら杞憂だと思うんだけど、もしかして組込み系? http://mevius.5ch.net/test/read.cgi/unix/1176807372/276
277: 名無しさん@お腹いっぱい。 [sage] 2011/02/10(木) 13:07:41 >>276 いえ、普通のLinuxマシンで、1TBほどのファイルサーバーをクロールしようと考えています。インデックスの容量とクロール時間を気にしています。 なので、とりあえずはファイル名と最初の数行だけをクロールしたいと考えていました。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/277
278: 名無しさん@お腹いっぱい。 [sage] 2011/02/10(木) 13:47:37 >>277 インデックスの容量 -> テキスト情報量に依存 クロール時間 -> クロール方法に依存 マニュアルをちゃんと読んでから検討したほうがいいよ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/278
279: 名無しさん@お腹いっぱい。 [] 2011/02/10(木) 23:56:21 最近のMinGWでコンパイルに成功したかたいますか? ライブラリ名が変更されてるのを修正すればコンパイルは通るのですが、 実行すると異郷終了します そもそもqdbmのmake checkでvtestが失敗するようで、 コンパイルできないのが正しいんでしょうか? 一応バイナリ版のqdbmを持ってきて実行しても やはりインデックス作成で異常終了してしまいました なにかポインタがあれば教えてください http://mevius.5ch.net/test/read.cgi/unix/1176807372/279
280: 名無しさん@お腹いっぱい。 [sage] 2011/04/14(木) 21:08:55.94 大文字小文字を区別して検索できるようにして欲しい http://mevius.5ch.net/test/read.cgi/unix/1176807372/280
281: 名無しさん@お腹いっぱい。 [sage] 2011/04/17(日) 12:28:30.18 インデックスがでかくなってくると速度落ちないですか? 回避する方法ありますか? http://mevius.5ch.net/test/read.cgi/unix/1176807372/281
282: 281 [] 2011/04/17(日) 12:31:21.73 >>251も自分だ。10ヶ月ほど前にも書き込んでたが。 解決策見つからず。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/282
283: 名無しさん@お腹いっぱい。 [sage] 2011/05/07(土) 18:02:40.44 >>251,281-282 この遅くなるって、 c:\hyperestraier\estcmd: INFO: flushing index words: name=index ... ってでてディスク凄いアクセスするようになって遅くなって感じですか? 自分は上記のような感じで ファイル数12500、総サイズ1.33G程度のHTMLファイルを スキャンし終わるまで14分位かかってしまいます。 オプションとしては次のようにしているのですが・・・ gather -il ja -lt -1 -lf -1 -pc CP932 -sd -cm -cs 400 http://mevius.5ch.net/test/read.cgi/un
ix/1176807372/283
284: 名無しさん@お腹いっぱい。 [sage] 2011/05/11(水) 20:07:25.33 もう見てる人居ないんだろうか http://mevius.5ch.net/test/read.cgi/unix/1176807372/284
285: 名無しさん@お腹いっぱい。 [sage] 2011/05/11(水) 20:21:05.25 見てるけど、開発が止まっちゃってて新しい話題がないよなー http://mevius.5ch.net/test/read.cgi/unix/1176807372/285
286: 名無しさん@お腹いっぱい。 [sage] 2011/05/12(木) 05:31:56.98 一応チェックリストには入れてる http://mevius.5ch.net/test/read.cgi/unix/1176807372/286
287: 名無しさん@お腹いっぱい。 [sage] 2011/05/13(金) 19:03:09.08 namazu と これくらいかー? 使える全文検索は。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/287
288: 名無しさん@お腹いっぱい。 [] 2011/07/13(水) 06:07:12.29 luceneで決まりだろ http://mevius.5ch.net/test/read.cgi/unix/1176807372/288
289: 名無しさん@お腹いっぱい。 [sage] 2011/07/13(水) 16:35:33.19 クラウドサービスの検索エンジンでタダで使えるのってあるのでしょうか? 全部Webに乗っけてしまって、site:付きでググってもらうのは他人に説明不要で楽なんだけど。 何一つ知らないので、どなたか詳しい方や使った経験ある人は紹介してくれませんか。 query文法を調整したり、著者名は特別扱いしたり、順位付けをカスタマイズしたり(それか不要な 結果をフィルタリングしたり)、出力のフォーマットを調整できればとかいう希望をもってます。 http://mevius.5ch.net/test/re
ad.cgi/unix/1176807372/289
290: 名無しさん@お腹いっぱい。 [] 2011/07/19(火) 00:44:48.88 今はkyotoだっけtokyoだっけ? http://mevius.5ch.net/test/read.cgi/unix/1176807372/290
291: 名無しさん@お腹いっぱい。 [sage] 2011/07/19(火) 12:55:07.65 作者がmixiからgoogleにいったよね http://mevius.5ch.net/test/read.cgi/unix/1176807372/291
292: 名無しさん@お腹いっぱい。 [sage] 2011/07/19(火) 14:38:11.73 >>291 へえ、ついに検索の総本山へか http://mevius.5ch.net/test/read.cgi/unix/1176807372/292
293: 名無しさん@お腹いっぱい。 [] 2011/08/13(土) 15:26:49.80 え?自分で会社作ってたんじゃなかったっけ?? http://mevius.5ch.net/test/read.cgi/unix/1176807372/293
294: 名無しさん@お腹いっぱい。 [sage] 2011/08/15(月) 10:45:08.18 失敗したんだって http://mevius.5ch.net/test/read.cgi/unix/1176807372/294
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 39 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.014s