DB検索プロジェクト (256レス)
1-

12
(1): 出来杉3.0 ★ 2008/07/17(木)15:45 ID:??? AAS
>>10
まあ個人的な考えではねw

DATあるいはDBが無くても、Sennaのインデックスがあれば検索できるし、スレッドのURLくらいはわかるわけですよ
スレタイが欲しいならsubjectをメモリにキャッシュしておけばいいし、Sennaは検索でヒットしたレス番まではわからないので、スレ内容は>>1の一部だけをキャッシュすればおkだったりとかで

それと方法の問題&要確認は…

phpを使う場合
 eAcceleratorには変数をキャッシュしておく機能が付いてるらしい
 しかし使いにくいと言う話が…
 (ただし詳しいことはまだ調べてませんので)

Perlを使う場合
省2
13: 出来杉3.0 ★ 2008/07/17(木)15:52 ID:??? AAS
あ、リロード><;

> サーバ
まあ、とりあえずスレタイくらいでいいなら、さくらプレミアムでも何とかなるでしょう
とりあえずはね^^;
14
(1): 萃香@飲酒係 ★ 2008/07/17(木)15:57 ID:??? AAS
Sennaって単体では使えませんよねぇ
DBにレコード登録して、その項目に対してインデックスを張る認識だったんですけど違うのかな
15
(1): P 2008/07/17(木)17:18 ID:rflf6R6o(1/5) AAS
私もDBにデータ突っ込んで、ミラーみたいにして
そこから検索するんだと思ってたwwww

あーなるほどー
16: 出来杉3.0 ★ 2008/07/17(木)17:18 ID:??? AAS
>>12の訂正
×Sennaは検索でヒットしたレス番まではわからないので
○Sennaは検索でヒットした部分の抜粋を作成できる
(これって"KeyWord In Content"と言うのか)

↑この機能を使うならDBの方がパフォーマンス的に優位かも??(しかしサーバが…)

>>14-15
Sennaは単体では使えませんが、DBは無くても使えますよ
DBを使うかどうかは前述のKWICを使うかどうかと言うところでしょう
そしてDBを使えるかどうかはサーバ次第ですかねw(VPSの安いプランとか)
17
(1): P 2008/07/17(木)17:37 ID:rflf6R6o(2/5) AAS
Sennaが抜粋してくれるなら、KWICでいいと思います
18
(1): P 2008/07/17(木)17:57 ID:rflf6R6o(3/5) AAS
DBとdatの代わりになるものが何かわかんないけど・・・
その方がいい予感がする
19
(2): 出来杉3.0 ★ 2008/07/17(木)18:13 ID:??? AAS
>>17-18
KWICを使うなら、ファイルorDBからヒットしたスレのDATの中身全部持ってきて、再検索する必要がありますw

もっと小容量のスレタイ&抜粋リストを使えば、そこに書かれてるものに関しては処理は早いはず

後者は専用プログラムを常駐させておいて、余裕のある時or検索CGIにくれくれされた時にDATを読み込んでキャッシュするといいんじゃないかなーと思ってる
それで検索CGIがそのリストを使うときは、名前付きパイプを通して送ると言う感じで

前者はとても抜粋内容のキャッシュなんかしてられないw
こっちにするならキャッシュ機能のあるDBを使うのがいいかと
20
(1): 荒巻@中の人 ★ 2008/07/17(木)18:19 ID:??? AAS
ちょっと今病気で倒れているのでおおざっぱにしかレスできないですが、

さくらプレミアムに検索クライアントを設置(表向きにクライアントに見えるIPはこいつっていうこと)
DBや検索などの実際の処理はあまり見せたくないIPのサーバーによって処理

っていうのは可能です。

つまりさくらに検索リクエストを整形してクライアントに送信するプログラムをおいて、実際のデータの蓄積とか、検索は実際には見えない後ろのサーバーでやると。

それならとある施設のグローバルIPと電源が使えるのでかなり性能の高いサーバーが設置できると思います。
21
(1): 荒巻@中の人 ★ 2008/07/17(木)18:20 ID:??? AAS
あ、もちろんrootつきで。
22: 出来杉3.0 ★ 2008/07/17(木)18:42 ID:??? AAS
>>20-21
病気で倒れてるって、大丈夫ですか?

個人的にはその方法で問題ないです
23: P 2008/07/17(木)19:49 ID:rflf6R6o(4/5) AAS
荒巻の人大丈夫?多忙だろうけど体壊してるときはゆっくり休んでください

>>19
どっちのほうがいいのかなぁ・・・
DB使えればその方がパフォーマンスはいいんでしたっけ
24: 2008/07/17(木)22:03 ID:rflf6R6o(5/5) AAS
実際、Sennaの機能とかよく分かってないので
出来杉案が無難だとは思うんですよね・・・

抜粋リストっていうのが良くわかんないですけど、テンプレートみたいなものですか?
25: 出来杉3.0 ★ 2008/07/18(金)19:03 ID:??? AAS
> 抜粋リストっていうのが良くわかんないですけど
外部リンク:find.2ch.net
↑の検索結果にはスレ内容の抜粋が載ってますよね

・スレの>>1から抜粋してメモリにキャッシュしておく
・検索結果を表示する時はいちいちDATを開かなくても、スレ内容の抜粋を取得できる
これが>>19の(スレタイ&)抜粋リスト方式です

ちなみにKWICと言うのは、前述の2ch検索みたいに
「ヒットしたスレ内から、検索キーワードを含む部分を探して抜粋する」
と言うものです
Sennaのインデックスからは元のスレ内容が取得できないので、ヒットしたスレの内容を全部を取得して、Sennaに投げる必要があります
省7
26: P ★ 2008/07/18(金)19:14 ID:??? AAS
実物見てようやくどんなのか分かりましたww

スレタイ検索に関しては、私は文句なしで抜粋方式でいいと思います
ただ本文検索やID検索もしたいってことらしいので・・・KWICをどれだけ軽量化出来るのかですかねww
27: 2008/07/19(土)00:38 ID:USq16Zoo(1) AAS
まずは荒巻の人のサーバ次第ですか・・・?
28: 出来杉3.0 ★ 2008/07/19(土)18:48 ID:??? AAS
ええ、サーバ次第ですかねぇ

KWICを使うならメモリはともかく、CPUにも再検索分の負荷がかかるので、それも考えないと
(CPUについては将来mreadもこっちに投げるとか言うならの話かも)

さっき全板(ごみ箱の5スレ含む)のsubjectを落として行数足したら、6559スレあるとか

〜以下はかなり適当な検証なので参考までに〜

メモリが512MBだとしたら、全スレメモリキャッシュできるかもしれないけど、できないかもと言うところなのかな…??
まあ、できればメモリは1GBはあった方が良さげ?と言うところかもしれない
29: 荒巻@中の人 ★ 2008/07/19(土)19:23 ID:??? AAS
一応ML115ベースでメモリは4G積んで、OSは64bitのFreeBSD7.0RE ってとこでどうでしょうか?
30: 2008/07/19(土)21:00 ID:8TrEwoAP(1) AAS
4G・・・
スペック的な知識無いですが、なんかすごいのは分かりました
31: P ★ 2008/07/20(日)02:52 ID:??? AAS
えっと、そのサーバのスペックなら
やりたかったことなんか出来そうな感じなんですか
1-
あと 225 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.185s*