全文検索エンジン Hyper Estraier 2 (333レス)
全文検索エンジン Hyper Estraier 2 http://mevius.5ch.net/test/read.cgi/unix/1176807372/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
24: 名無しさん@お腹いっぱい。 [sage] 2007/06/20(水) 03:25:39 estcmd search -ord のあとに何をかけばいいのかわかんねー。 rubyの二つの bindingもどういう得失があるんだろう.. やっぱり purerubyだとちょっと遅いとか?? ちょっとソースに diveしてくる。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/24
25: 名無しさん@お腹いっぱい。 [] 2007/07/02(月) 22:06:30 mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに:ニュース - CNET Japan http://japan.cnet.com/news/media/story/0,2000056023,20352009,00.htm Hyper Estraier あげ http://mevius.5ch.net/test/read.cgi/unix/1176807372/25
26: 名無しさん@お腹いっぱい。 [sage] 2007/07/03(火) 09:54:12 mixy日記はコーパスとしておもしろそうだよねえ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/26
27: 名無しさん@お腹いっぱい。 [sage] 2007/07/04(水) 20:56:32 namazu.el と同じようなフロントエンドおねがいしますー。 上にあったlookupじゃ使いにくいです。 リターン一発で編集したいです。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/27
28: 名無しさん@お腹いっぱい。 [] 2007/08/26(日) 14:16:34 Windowsバイナリ版で作成したインデクスと付属CGI(estseek.cgi及び関連ファイル)は そのままレン鯖にうpしても動かないですかね? 試用段階なのだけど、なにか違うんだろうか。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/28
29: 28 [sage] 2007/08/26(日) 15:33:46 ご、ごめん、いずれにしてもRubyからアクセス(検索)することになるので そっちをテストしたらうまくいきました。 付属CGIが動かない理由はまだわからないけど、 自分でもいまいち整理できてないですし、 estseek.cgiは使わないので質問は取り下げます。 ごめりんこですm(_ _)m http://mevius.5ch.net/test/read.cgi/unix/1176807372/29
30: 名無しさん@お腹いっぱい。 [sage] 2007/09/04(火) 21:14:26 ちかごろ良さげなパッチがMLに 流れてるが、作者はマージせんのか。 中華、作者はメンテしてんのか? http://mevius.5ch.net/test/read.cgi/unix/1176807372/30
31: 名無しさん@お腹いっぱい。 [sage] 2007/09/05(水) 02:18:45 確か1.4.9と1.4.10の間も長かったな。 mixi移籍後社内業務で手一杯なのか開発速度が大幅に落ちた希ガス http://mevius.5ch.net/test/read.cgi/unix/1176807372/31
32: 名無しさん@お腹いっぱい。 [sage] 2007/09/05(水) 11:32:08 Tokyo Cabinet なんてのも作ってるしなあ。 QDBM ともども H.E. もこのまま放置されたりして。 http://tokyocabinet.sourceforge.net/ つーか代わりにメンテナに立候補する香具師はおらんかなあと思う今日このごろ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/32
33: 名無しさん@お腹いっぱい。 [sage] 2007/10/28(日) 19:54:12 >>32 開発スピードが遅くなるのはいいんだけど、放置プレイだけが心配だなぁ。 Tokyo Cabinet で QDBM の不満点を解消したとかいってるし、QDBM 放置 → H.E. も放置な流れの気配が… http://mevius.5ch.net/test/read.cgi/unix/1176807372/33
34: 名無しさん@お腹いっぱい。 [] 2007/11/05(月) 14:51:27 100万レコードくらいのインデックスを作成したいのですが、 mysqlのエラーで止まります。何かいい方法ありますか? http://mevius.5ch.net/test/read.cgi/unix/1176807372/34
35: 名無しさん@お腹いっぱい。 [sage] 2007/11/06(火) 00:03:34 そもそもmysqlのエラーというのが発生する経緯がわからん どういう使い方をしているのか、それを説明したまえ http://mevius.5ch.net/test/read.cgi/unix/1176807372/35
36: 34 [] 2007/11/06(火) 19:34:03 >35 レスありがとうございます。 hyperestraierとacts_as_searchableというrailsのプラグインを使って、全文検索を行いたいと考えています。 acts_as_searchableに備わっているreindex!というメソッドを実行すると、インデックスが構築される仕様になっているのですが、 これを実行すると、だんだん処理が重くなり、最終的にはMysql::Error: Lost connection to MySQL server during queryというエラーが出てしまいます。 reindex!というメソッドはデフォルトでは対象になるレコードを一気にメモリにのせてしまうので、 そのあたりは負荷を減らすようなコードに修正して実行しています。 (このような感じです。ttp://d.hatena.ne.jp/yune_kotomi/20070912/1189617411) hyperestraierのメーリングリストで、mysqlのLost Connectionを改善する mysql_retry_lost_connectionというrailsのプラグインを教えて頂いたのですが、 インストールしても効果がなく、どうも、接続が切れる前の段階でつまずいているような気がします。 対象レコード数は100万弱で、途中で止まってしまいましたが、 #docs => 22897、#words => 196666まではいけました。 なにかアドバイスいただければ幸いです。 よろしくお願いします。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/36
37: 名無しさん@お腹いっぱい。 [sage] 2007/11/07(水) 11:56:45 そのMySQLのqueryとやらは、その先の処理が何時間かかろうともいつまでも待ってくれるの? 単にタイムアウトしているだけのような気が... http://mevius.5ch.net/test/read.cgi/unix/1176807372/37
38: 名無しさん@お腹いっぱい。 [sage] 2007/11/08(木) 01:02:45 つーかMLとマルチ?やるなあおい http://mevius.5ch.net/test/read.cgi/unix/1176807372/38
39: 名無しさん@お腹いっぱい。 [sage] 2007/11/08(木) 08:42:09 作者こないね http://mevius.5ch.net/test/read.cgi/unix/1176807372/39
40: 名無しさん@お腹いっぱい。 [sage] 2007/11/08(木) 22:48:10 マルチっていうより、ML で有効なレスポンスがないからこっちにも、ってことだろう。 残念ながら俺は MySQL と組み合わせたことも Rails も使ったことがないからよくわからん。 つか普通 MySQL で全文検索するんだったら Senna じゃね? http://mevius.5ch.net/test/read.cgi/unix/1176807372/40
41: 名無しさん@お腹いっぱい。 [sage] 2007/11/11(日) 18:28:54 いや、だからさ、作者はメンテする意思あんのか、と。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/41
42: 名無しさん@お腹いっぱい。 [] 2007/11/12(月) 00:50:42 メンテナンスに関しては、開発者コミュニティが形成されていない のがダメな点だな。 作者の手を煩わせてはいかんよ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/42
43: 名無しさん@お腹いっぱい。 [sage] 2007/11/12(月) 08:59:50 いやでもパッチ投げても直接マージされるわけじゃなく、本人がリライトして 著作権保持者を維持してるので、開発コミュニティの形成はforkでもしないと 無理だよ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/43
44: 名無しさん@お腹いっぱい。 [sage] 2007/11/12(月) 10:29:24 作者がmixiじゃなくgoogleに就職していれば… http://mevius.5ch.net/test/read.cgi/unix/1176807372/44
45: 名無しさん@お腹いっぱい。 [] 2007/11/12(月) 10:59:56 googleに行ったフーリソフトウェア者も沈黙しちゃってる件(泣) http://mevius.5ch.net/test/read.cgi/unix/1176807372/45
46: 名無しさん@お腹いっぱい。 [sage] 2007/11/12(月) 19:53:49 マイクロソフトはソース見たらフリーウェアに参加で着なくなるけどほかのも? http://mevius.5ch.net/test/read.cgi/unix/1176807372/46
47: 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 14:39:17 estseek.cgiで属性検索しても結果に出てこないのはなんで? [UVSET]してるけどなー http://mevius.5ch.net/test/read.cgi/unix/1176807372/47
48: 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 14:44:41 あとgather -aa @uri STRで属性インデックスつけてるけど やっぱ遅いですね 属性検索で速く検索する方法ありますか http://mevius.5ch.net/test/read.cgi/unix/1176807372/48
49: 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 18:22:16 >>48 それ属性インデクス追加のオプションだっけ? おれは estcmd create -attr @uri str idx とかやって属性インデクス付けたよ. 1000万件位のレコード数だったけど,URI検索は体感できるほど 速くなった. http://mevius.5ch.net/test/read.cgi/unix/1176807372/49
50: 名無しさん@お腹いっぱい。 [] 2007/11/29(木) 10:43:00 >>39-45 で、いざ新バージョンが出たら沈黙ってなんだよ。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/50
51: 名無しさん@お腹いっぱい。 [sage] 2007/11/29(木) 13:26:34 http://hyperestraier.sourceforge.net/index.ja.html > 最新のソースパッケージ(バージョン1.4.12) あれ、いつの間に。 ML 入ってるけどリリース情報なかったぞ。 何にせよ復活age. ただ、ChangeLog 見る限り、 2007-11-18 Mikio Hirabayashi <mikio@users.sourceforge.net> * estraier.c: code clean-up. - Bugs related to type casting of perl binding were fixed. - Release: 1.4.12 2006-11-11 Mikio Hirabayashi <mikio@users.sourceforge.net> * estraier.c (est_resmap_add): "method" argument was added. * estraier.c (est_inode): a bug related to overflow was fixed. * estraier.c (est_narrow_score): a bug related to attribute distinction was fixed. * estraier.c (est_search_union): search accuracy with trailing uni-gram was improved. * estmaster.c (searchlocal): a bug related to scanning with regular expressions was fixed. * estscout.c (realmain): "union", "score", and "idsuffix" attributes were added. * estsupt.c (realmain): "score" attribute was added. * estsupt.c (procsearch): accuracy of hint was improved. * estsupt.c (realmain): "logmsg" parameter was added. * estscout.c (realmain): "distinct" parameter was added. * estscout.c (showresult): cache clear at random was added. - Release: 1.4.11 ここのところ精力的に ML に投げられてたパッチはマージされてなさげ? http://mevius.5ch.net/test/read.cgi/unix/1176807372/51
52: 名無しさん@お腹いっぱい。 [sage] 2007/12/05(水) 19:46:42 pthreadsライブラリのないシステムで動かしたいんですが なんとかならんですかね。 http://mevius.5ch.net/test/read.cgi/unix/1176807372/52
53: 名無しさん@お腹いっぱい。 [] 2007/12/06(木) 19:59:56 Chimera Search(キメラ・サーチ) http://www.osstech.co.jp/product/chimera > 構築コンポーネントに以下のOSS(オープンソースソフトウェア)を利用 > しているため、安価に導入できるのに高性能・高機能を発揮します。 > * プログラム言語: Rubyおよび Ruby On Rails > * 全文検索システム : Hyper Estraier http://mevius.5ch.net/test/read.cgi/unix/1176807372/53
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 280 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.015s