DB検索プロジェクト (256レス)
前次1-
抽出解除 レス栞

1
(3): 伊吹萃香◆SUICAthVuI 2008/07/15(火)11:21 ID:nbUQSmQo(1/2) AAS
現状の検索が重すぎるため、書き込みをDB登録して
そっちで検索かけようというプロジェクトです
夏休み前に運用開始できたらいいなぁ・・・

このへんとかも参照のこと
■ 【祝】 サーバー購入のお知らせ
vip2chスレ:operate

◆仕様とか
・運用開始からのデータのみ検索対象
・検索サーバは別立て。ex14とは切り離す

◆現状
省12
12
(1): 出来杉3.0 ★ 2008/07/17(木)15:45 ID:??? AAS
>>10
まあ個人的な考えではねw

DATあるいはDBが無くても、Sennaのインデックスがあれば検索できるし、スレッドのURLくらいはわかるわけですよ
スレタイが欲しいならsubjectをメモリにキャッシュしておけばいいし、Sennaは検索でヒットしたレス番まではわからないので、スレ内容は>>1の一部だけをキャッシュすればおkだったりとかで

それと方法の問題&要確認は…

phpを使う場合
 eAcceleratorには変数をキャッシュしておく機能が付いてるらしい
 しかし使いにくいと言う話が…
 (ただし詳しいことはまだ調べてませんので)

Perlを使う場合
省2
25: 出来杉3.0 ★ 2008/07/18(金)19:03 ID:??? AAS
> 抜粋リストっていうのが良くわかんないですけど
外部リンク:find.2ch.net
↑の検索結果にはスレ内容の抜粋が載ってますよね

・スレの>>1から抜粋してメモリにキャッシュしておく
・検索結果を表示する時はいちいちDATを開かなくても、スレ内容の抜粋を取得できる
これが>>19の(スレタイ&)抜粋リスト方式です

ちなみにKWICと言うのは、前述の2ch検索みたいに
「ヒットしたスレ内から、検索キーワードを含む部分を探して抜粋する」
と言うものです
Sennaのインデックスからは元のスレ内容が取得できないので、ヒットしたスレの内容を全部を取得して、Sennaに投げる必要があります
省7
64
(1): 出来杉3.0 ★ 2008/07/29(火)16:13 ID:??? AAS
>>63
> ミーフォ茜 ◆BtIJSeriko (PHP担当) P(Perl担当) 伊吹萃香 ◆SUICAthVuI (DB担当)
> の三方が作られていた検索プログラムを先行的に導入してみますた.
把握しますた

ところで思ったのですが、スレッドのプレビューは>>1よりもKWICよりも、現行のスレ内で最初にヒットしたレスを表示するのが良さげですかね?
まあ、そのへんはアンケートでも採るのがいいんでしょうけど

以下個人的なToDo
・検索スクリプト作成の踏み台として作ってる、subject.txtがぬっこわれないようにするスクリプトをとりあえず使えるようにする
 (今月中、と言いたいところだが今週中…いや8/9までに作る^^;)
・ローカルの新実験環境を構築(PortsがアレなのでやっぱLinuxで、早くて8月後半)
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.226s*