DB検索プロジェクト (256レス)
DB検索プロジェクト http://ex14.vip2ch.com/test/read.cgi/operate/1216088472/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
19: 出来杉3.0 ★ [sage] 2008/07/17(木) 18:13:50.13 ID:??? >>17-18 KWICを使うなら、ファイルorDBからヒットしたスレのDATの中身全部持ってきて、再検索する必要がありますw もっと小容量のスレタイ&抜粋リストを使えば、そこに書かれてるものに関しては処理は早いはず 後者は専用プログラムを常駐させておいて、余裕のある時or検索CGIにくれくれされた時にDATを読み込んでキャッシュするといいんじゃないかなーと思ってる それで検索CGIがそのリストを使うときは、名前付きパイプを通して送ると言う感じで 前者はとても抜粋内容のキャッシュなんかしてられないw こっちにするならキャッシュ機能のあるDBを使うのがいいかと http://ex14.vip2ch.com/test/read.cgi/operate/1216088472/19
23: P [sage] 2008/07/17(木) 19:49:55.92 ID:rflf6R6o 荒巻の人大丈夫?多忙だろうけど体壊してるときはゆっくり休んでください >>19 どっちのほうがいいのかなぁ・・・ DB使えればその方がパフォーマンスはいいんでしたっけ http://ex14.vip2ch.com/test/read.cgi/operate/1216088472/23
25: 出来杉3.0 ★ [sage] 2008/07/18(金) 19:03:54.60 ID:??? > 抜粋リストっていうのが良くわかんないですけど http://find.2ch.net/?STR=%A5%D6%A5%E9%A5%B8%A5%EB&COUNT=10&TYPE=TITLE&BBS=2ch ↑の検索結果にはスレ内容の抜粋が載ってますよね ・スレの>>1から抜粋してメモリにキャッシュしておく ・検索結果を表示する時はいちいちDATを開かなくても、スレ内容の抜粋を取得できる これが>>19の(スレタイ&)抜粋リスト方式です ちなみにKWICと言うのは、前述の2ch検索みたいに 「ヒットしたスレ内から、検索キーワードを含む部分を探して抜粋する」 と言うものです Sennaのインデックスからは元のスレ内容が取得できないので、ヒットしたスレの内容を全部を取得して、Sennaに投げる必要があります これをメモリキャッシュを使い高速に行うには、DBを使うのがスマートでしょう (ただし独自にキャッシュ管理スクリプトでも組めば、DB使うより早いかも) > どっちのほうがいいのかなぁ・・・ ・スレタイ&抜粋リスト方式 = 作るの楽、動作は速くて軽い、でもちょっとスレ見つけづらいかも? ・KWIC = 作るの面倒、動作は遅くて重い、でもちょっとスレを見つけやすいかも? まあこんなとこでしょう (スレタイ検索の場合は「スレタイ&抜粋リスト方式」の方が便利だったりしてw) http://ex14.vip2ch.com/test/read.cgi/operate/1216088472/25
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.183s*