Namazu全文検索システム (375レス)
上下前次1-新
1: 名無しさん@お腹いっぱい。 [ ] 2001/06/14(木)09:17 ID:??? AAS
全文検索システム Namazu
外部リンク:www.namazu.org
日本語全文検索エンジンソフトウェアのリスト
外部リンク[html]:www.kusastro.kyoto-u.ac.jp
前スレ 外部リンク[cgi]:tako.2ch.net
2: 名無しさん@お腹いっぱい 2001/06/14(木)15:26 ID:??? AAS
いか焼きそば
3: 名無しさん@お腹いっぱい。 2001/06/15(金)01:24 ID:??? AAS
namazuはカスタマイズがやりにくいのが嫌いだ。
作り直しきぼん。
4(1): 名無しさん@お腹いっぱい。 [0] 2001/07/05(木)09:41 ID:??? AAS
外部リンク[htm]:64.124.197.202
namazuってやっぱり負荷かかるのかな。
5(1): 名無しさん@ディストリいっぱい 2001/07/05(木)10:22 ID:wD33sdDI(1) AAS
>>4
index作る時にはCPU使用率100%になります。
項目がいくつもあるとかなりツライです。
↓うちのNamazu
外部リンク:2ch.dyn.to
6: 名無しさん@お腹いっぱい。 [0] 2001/07/05(木)17:05 ID:??? AAS
100%?(w
すご・・・
7: でり 2001/07/06(金)02:36 ID:??? AAS
>>5 ん、それは負荷テストに参加してくれというお誘いかな (w
8: 名無しさん@お腹いっぱい。 2001/07/09(月)00:57 ID:muVIdrhs(1) AAS
ここ見てユーザーディレクトリにインストしちゃっていいもんでしょうか?
外部リンク[html]:www.amays.com
当方レンタルサーバー 専用サーバー持つ金ありません。
C言語は使えます。負荷のかからないように、自分のマシンでindex作ればいいかな。
っていうかレンタルサーバー会社に聞かずにやっちゃって、かまわんかしら(汗
9: 名無しさん@お腹いっぱい。 2001/07/25(水)04:10 ID:OjwNZy2I(1) AAS
インデックス構築中に検索かけられるとCGI TimeOut出ちゃうことが多々あります・・・
外部リンク:www1.odn.ne.jp
10: 名無しさん@お腹いっぱい。 2001/07/25(水)18:41 ID:smjKvwXM(1) AAS
nice で優先度落とせばいいじゃん。
11: 名無しさん@お腹いっぱい。 2001/08/01(水)18:06 ID:ix6uIOfU(1) AAS
windowsだし。
12(1): ナナ萌え(゚д゚)ウマー [(゚д゚)ウマー] 2001/08/02(木)00:34 ID:??? AAS
WIN2Kに入ってるインデックスサービスってどーなん?
13: 名無しさん@お腹いっぱい。 2001/08/04(土)01:50 ID:aNwZ.JX.(1) AAS
>>12
穴。まさぐられると逝ってしまうぞ。
14: 名無しさん@お腹いっぱい。 2001/08/10(金)14:53 ID:A94SLV6Y(1) AAS
2.0.6 release age
15(1): 初心者 2001/08/11(土)11:52 ID:??? AAS
NAMAZUのインデックスにはたくさんファイルがありますけど、
いらないファイル(テンプレート等)も多いと思います。
結局必ず必要なファイルってどれなんですか?
16: 名無しさん@お腹いっぱい。 [0] 2001/08/12(日)00:26 ID:??? AAS
>>15
んー俺もそう言えばわからん、
もともと、俺にとって、このNamazu初めの頃難しすぎた。
その前に、うなぎ食いたいんだよね。腹減ってきた・・・
17(1): NAMANAMA 2001/08/12(日)01:02 ID:TrSLsWVY(1) AAS
namazu2.0.5なんだけど、共有サーバにインストールしたんですよ。
でも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。
そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね?
それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか?
マジレスお願いします。
18: むぎ茶 [むぎ茶 ] 2001/08/12(日)01:08 ID:??? AAS
AA省
19: 名無しさん@お腹いっぱい。 2001/08/12(日)01:24 ID:??? AAS
>>17
負荷はかからないけど、ローカルは、めんどくせぇ(涙
20(1): 名無しさん@お腹いっぱい。 2001/08/12(日)17:40 ID:KkZ3OuWw(1) AAS
Namazu.pm使ってperlでCGIを作りたいんですが…
Namazu.pmってあまり人気がないんですか?
参考スクリプト(書籍・サイト)がなかなか見つからなくって
何かありませんか?
21: 名無しさん@お腹いっぱい。 2001/08/15(水)21:03 ID:??? AAS
>>20
ない、と思う。
まあしかし機能はシンプルなことこのうえないので、
利用にあたってそんなに難しいこともないと思うけど。
Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。
22(3): 名無しさん@お腹いっぱい。 01/08/28 05:33 ID:aw.N/Mco(1) AAS
どう?namazu使ってつくったやつ。
とりあえず2ちゃんねる全板検索可能です。
外部リンク:mimizun.mine.nu
23: 名無しさん@お腹いっぱい。 [0] 01/08/28 21:59 ID:1JnfOa0A(1) AAS
お奨め本おしえte
24(1): 名無しさん@お腹いっぱい。 01/08/29 00:17 ID:TsF5AU7k(1) AAS
>>22
これ、すげぇじゃん。
25: 名無しさん@お腹いっぱい。 01/08/29 02:52 ID:1UTTw6kk(1) AAS
>>24
どこが?
26: 名無しさん@お腹いっぱい。 01/08/30 12:01 ID:8CpRLBMo(1) AAS
namazaってCGIやSSIで出力する内容も検索するんですか?
27: 名無しさん@お腹いっぱい。 01/08/30 12:11 ID:3TFNK/cI(1) AAS
namazaは知りませんが
Namazuで検索できるのは「ファイル」だけのようです。
28(2): 名無しさん@お腹いっぱい。 01/08/30 23:03 ID:YzLgVA/.(1) AAS
はやくpostgresqlのテーブルの中身を検索できるようになっておくれ。
29: 名無しさん@お腹いっぱい。 01/09/10 22:31 ID:2EURowzo(1) AAS
>>22
みずずん大丈夫?
30(1): 名無しさん@お腹いっぱい。 01/09/10 22:32 ID:??? AAS
みみずんか(藁
31(1): 名無しさん@お腹いっぱい。 01/09/11 12:11 ID:liJMw8bE(1) AAS
XMLの検索ってどうなの?
32: 名無しさん@お腹いっぱい。 01/09/17 18:14 ID:??? AAS
>>31
filter 書いてくれ。
33: 名無しさん@お腹いっぱい。 01/09/17 18:18 ID:dMB6uEtM(1) AAS
>>28
Namazuシステムの構築と活用, ソフトバンク
やっぱこれじゃない?
34(1): 名無しさん@お腹いっぱい。 01/09/17 18:21 ID:FURvtMLg(1) AAS
>>28 PostgreSQLスレッドで誰かやってなかったっけ?
35: 名無しさん@お腹いっぱい。 01/09/17 23:18 ID:??? AAS
>>34
よく知らないけど、pgnmz はPostgreSQLにNamazuのインデックスを
入れておいて、DBにクエリー投げて検索結果を出すという感じっぽいので、
テーブル内容検索とはちがうっぽい。
外部リンク[html]:search.namazu.org
36(2): 名無しさん@お腹いっぱい。 01/09/20 17:20 ID:TUOJrHAw(1) AAS
PHPファイルを検索できるようにするにはどうすれば良いんですか?
ソースがまんま出ちゃうんですけど。
37(1): 名無しさん@お腹いっぱい。 01/09/26 22:51 ID:9178Yr9s(1) AAS
>>36
PHP の出力を検索させたいのなら出力した結果をファイルにして
それにインデックスをかけるとかしないと無理。
38(1): 36 01/09/27 00:11 ID:IzjiFxn2(1/2) AAS
>>37
「出力した結果をファイルにする」ってのは、phpでですか?
なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。
Namazuシステムの構築本に書いてないかなー
39(3): 名無しさん@お腹いっぱい。 01/09/27 01:15 ID:??? AAS
>>38
php のことよく知らないけど
php scriptname.php ってやったら出力されないかな?
ところで俺も質問なんだけど、namazu.cgi って検索後は
ファイルへのリンクを 外部リンク:hostnameで出力するけど、
こいつを file://hogehoge にする方法って無い?
windows でローカルファイルの検索に使いたいんだけど WEB で
探しても見つからなかった。
40(2): 名無しさん@お腹いっぱい。 01/09/27 17:20 ID:IzjiFxn2(2/2) AAS
>>39
php scriptname.phpだとコマンドすら無いって言われてしまう。
指定先は.namazurcってファイルで設定できる↓参照
外部リンク[htm]:village.infoweb.ne.jp
41(1): 名無しさん@お腹いっぱい。 01/09/27 22:04 ID:clsPKe1Y(1) AAS
コマンド版のPHPがないとダメじゃないかねえ。
>>39 はインデックス作成時に
mknmz --replace='s#^#file:///'
とかでもいけそうだけどどうよ。
42: 39 01/10/01 05:28 ID:UjeefWpE(1) AAS
2chNo1(と思える)過疎板にて反応があって感動。
>>40
.namazurc で
Replace 外部リンク:localhost file://
と指定してみてたんだけど、どうやら無効の模様。
この部分(外部リンク:hostname)は固定で出力してるのかな?
>>41
やってみたけどだめっぽい。
でも他にそれらしいオプションも見つからないね・・・
こういう変な事やる時は cgi 改造しか無いのか、とほほ。
pnamazu か rbnamazu に挑戦してみよう。
ところで >>40 はうまくいったかな?
アパッチのモジュール lib_php3.so (だっけ?) しか
インストールされてない時は >>41 の 言う通りコマンド
ラインで使えるようにしよう。手動で最初からやってみ
たこと無いので詳しい説明できなくてごめん。
43: 40 01/10/04 19:40 ID:4sun3RUk(1) AAS
返事遅れてスマソ。
>> 39
うちは
Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/ 外部リンク:ark
みたいな感じになってる。ちなみにこの行と
Lang ja_JP.SJISと書かれた行以外は全てコメントアウト
php検索はコマンドラインで使えるように設定してみます。
というかコマンドラインで使えるようにする方法すら知らないんだけど。
どこか書いてるとこ知りません? 本でも良いんですけど。
44: アナログから光までオッケー 01/10/05 02:03 ID:7kq.xdqk(1) AAS
このサイトはみなさんのインターネット環境の
スピードを計ってくれます。また、遅いと思う
人は設定を少し変えることによって無料で
スピードを早くすることができます。
お金を出す前に一度試してみては
いかがでしょうか。上がりの計測も可能です。
外部リンク:cym10262.omosiro.com
45: 22 01/10/05 02:47 ID:UlE8Ntsc(1) AAS
外部リンク:www.max.hi-ho.ne.jp
46: 名無しさん@お腹いっぱい。 01/12/09 11:02 ID:eU0f+J4K(1) AAS
だめだ〜Out of Memory!で止まっちゃうよ〜。
一応FAQに書いてあることは試したつもりなんだが・・・。
どうも特定のファイルの時にそうなってるみたい。
なんか落ちやすい文字とか、そういうのあるんかな?
47: 名無しさん@お腹いっぱい。 01/12/10 22:24 ID:UuNX8sYB(1) AAS
設定の問題かどうか
48: 名無しさん@お腹いっぱい。 01/12/15 22:02 ID:??? AAS
ulimit がらみだと思うけど > Out of Memory
もしくは本当にメモリ(+仮想メモリ)が足りないか。
49(2): 名無しさん@お腹いっぱい。 02/01/04 06:04 ID:HxTTmUTv(1) AAS
use POSIX 'strftime';
print strftime "%Y%m%d\n", localtime;
こう書くと年月日が出るじゃないですか。
この日付けに7を足す事ってできます???
50: 名無しさん@お腹いっぱい。 02/01/04 06:04 ID:??? AAS
>49
マルチうざい
資ね!
51: 名無しさん@お腹いっぱい。 02/01/04 23:19 ID:??? AAS
>>49
逝って良し。
■解説■
マルチは下げ進行で微妙に煽りつつシカトします
上記例のように古典的な煽りは「逝って良し」
他にアスキーアートを使ったものなど多彩ですが、
サーバーの不可を考慮してかあまり好まれません。
やはりシンプルに「氏ね」など短文なものがベストです。
52: 名無しさん@お腹いっぱい。 [age] 02/01/09 18:03 ID:??? AAS
あげ
53: 名無しさん@お腹いっぱい。 [age] 02/01/12 04:40 ID:??? AAS
age
54(1): 名無しさん@お腹いっぱい。 02/01/13 16:11 ID:??? AAS
もう、、下げといてやれよ。。
55: 名無しさん@お腹いっぱい。 02/01/13 19:32 ID:??? AAS
>>54
再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)
56: 名無しさん@お腹いっぱい。 02/01/25 06:48 ID:YyTiWZ/9(1) AAS
半年で、50位か。1000までいったら感動するな。あげ
57: 名無しさん@お腹いっぱい。 02/02/18 08:00 ID:TWCf5+1d(1) AAS
age
58: 1001 Over 1000 Thread 02/02/18 10:21 ID:Qb17d1xd(1) AAS
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
59: 名無しさん@お腹いっぱい。 02/02/19 07:42 ID:DggBq+7H(1) AAS
age
60: 名無しさん@お腹いっぱい。 02/02/20 22:28 ID:??? AAS
関連スレ
全文検索エンジンNamazu @ Unix板
2chスレ:unix
61(3): 02/03/11 21:08 ID:Jt12j7IU(1) AAS
namazuの検索、なんか使いにくいんだけど。。
変に文節で区切らずに、googleみたいに普通に検索してくれたら
それでいいのに。。
62: 02/03/11 23:50 ID:??? AAS
>>61
うん。
63: 02/03/12 07:59 ID:qMnzd5b/(1) AAS
>>61
これのこと?
>日本語がでたらめにわかち書きされてしまう
>{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、
>でたらめにわかち書きされることがあります。
>これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。
>検索はあきらめましょう。
それとも、インデックス作るときの分かち書きをしないでほしい、ってこと?
それって実現できるのか?
64: 02/03/18 17:35 ID:??? AAS
googleはユーザーにあまり意識させないだけで、分けて探してるよ
65(1): 02/03/19 11:29 ID:ulLvfL7+(1) AAS
googleわけてるかな?
日本語は解析していないように見えるけど…。
英語はスペースでわけるだけだから楽だね。
それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。
つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。
ローカルでほしい、、
66(1): 02/03/19 12:54 ID:TPtrOTqR(1/2) AAS
>>65
googleも分かち書きしてるらしい、という実験結果がある。
検索エンジンのしくみ教えます
外部リンク:www.google.com
なんか 403 forbidden になってるんでgoogleのキャッシュで見てね。
67: 02/03/19 14:31 ID:??? AAS
>>66 さん、ありがとうございます。
ほんとだ。分かち書きしてる、、
うむ、googleはちゃんと各言語ごとにチューンしてるんですね。
68(1): 02/03/19 15:32 ID:TPtrOTqR(2/2) AAS
逆に言えば、分かち書きエンジンの精度さえ向上させれば、
google並みのことはできるってことだよね
(もちろん、PageRank とかは抜きにして)。
いつも kakasi だけど、Chasen を使ってみようかなあ・・・。
69: 02/03/19 15:52 ID:??? AAS
個人で使うような件数の多寡が知れているようなシステムだったら、純粋に全件マッチ検索の方が便利だよね。
70(2): 02/03/19 20:25 ID:??? AAS
>>68
googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ)
なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。
ヒット数が少ない場合、関係ないけど。
71: 02/03/19 20:38 ID:??? AAS
>>70
その点は激しく同意。
ただ、分かち書きの精度を上げることで、
>>61 のやりたいことは実現できるんじゃないかな、って思った。
72: 02/04/24 13:48 ID:??? AAS
(´_ゝ`)フーン
73: ato 02/05/09 14:31 ID:8gc3nIf4(1) AAS
Namazu使ったPDFの全文検索でページしていとかできますか?
74: 02/05/10 00:55 ID:??? AAS
Namazu使ったJPGの全文検索でページしていとかできますか?
75(1): 02/05/10 02:55 ID:??? AAS
>>70
いまさらだが、NamazuへのPageRankの実装は、この論文が有名。
外部リンク[html]:www.kusastro.kyoto-u.ac.jp
76: 02/05/10 07:02 ID:??? AAS
>>75
まだ、このスレが生きていたとはね
興味深い文章サンクス。
改めて深入りできない、しちゃいけない分野だと再確認したよ
77: 02/05/10 20:41 ID:??? AAS
AA省
78: 02/05/24 03:19 ID:??? AAS
(・∀・)イイ!
79: 02/05/27 19:51 ID:LrpMVRit(1) AAS
類似スレッド
WWW検索エンジンサイト
2chスレ:esite
80: 02/06/06 04:44 ID:jW1FwXu2(1) AAS
ひさしぶり!
81: 02/06/09 00:21 ID:MvwsaEnI(1) AAS
コレ、namazuの対抗馬になれるか?
外部リンク:freshmeat.net
82(1): 山拓変態問題 [期待age] 02/06/20 09:30 ID:??? AAS
mp3用のフィルタって誰か書いてないかしら?
83(1): 02/06/20 09:39 ID:updula6F(1) AAS
Namazuでmp3用のフィルタ???
わからん、俺がアフォなだけか?
84(1): 02/06/20 12:41 ID:0pQ6ektu(1) AAS
>>82
ID3タグでも検索するのか?
そういうのは ふつー DB 使うだろ。
85: 山拓変態問題 [期待age] 02/06/20 15:09 ID:??? AAS
>>83-84
自分のホームヂレクトリをクロンで毎晩なめてるんだけど、
どうせなら、ID3も見てくれないかなと。
変かなぁ。
86(1): 82=85 02/06/20 15:34 ID:??? AAS
って、WEBプログラミングとは、違いますな。
スレ違いスマソ。
87: 02/06/25 01:01 ID:cgKxt6dS(1) AAS
>>86
なるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、
検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。
やってることは google のイメージ検索みたいな感じかな。
perl でサクッと書けそうな雰囲気。
ぜひトライしてみて。
あと、Web プログラミングとは関係ないけど、
Namazu に関係あればいいと思うよ。
88: 02/06/25 02:46 ID:??? AAS
いや、それをWebから使えるようにすりゃWebプログラミングと
むちゃくちゃ関係あるじゃん。
> やってることは google のイメージ検索みたいな感じかな。
イメージ検索は外部から関連性を持ってくるのでちと違うような。
内部のID3だけだったらPDF検索くらいに対応するだろう。
ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら
やっぱり便利かも。
89: 02/08/12 22:58 ID:??? AAS
うなぎ食べたいね。
90: 02/09/02 23:28 ID:??? AAS
ナマズマズー
91: 02/09/20 08:19 ID:??? AAS
ウマー
92: nobody [age] 02/09/21 15:05 ID:??? AAS
検索結果で表示されるファイルの先頭部分のサイズを変更できますか?
やりかたを教えて下さい。
93: 02/09/25 08:37 ID:3VOnIdJA(1) AAS
wget
でURLテキスト-iで、ディレクトリ作成-x
しながらページ拾ってくると、
稀にディレクトリ作成(www.aaa.xxx)されなくて
関係ないディレクトリ(www.bbb.xxx)にページを
格納してしまいます。
このままindex作るとURLリンクが関係ないところに。
どうしてだろう。困った。
94: 02/09/27 20:30 ID:7S/gcFrV(1) AAS
Office XPファイルは、インデキシングできないのかなぁ。
95: 02/09/28 02:50 ID:gf1ROtiY(1) AAS
@ノハ@
ピュー( ‘ д‘)
=〔~∪ ̄ ̄〕
=◎−−◎
96: 名無しさん@お腹いっぱい。 02/10/07 17:04 ID:ucR8g7pl(1/2) AAS
@ハヽ@
(' д ‘)ピュー
〔~∪ ̄ ̄〕=
◎−−◎=
づかれたゾイ
97: 名無しさん@お腹いっぱい。 02/10/07 17:05 ID:ucR8g7pl(2/2) AAS
↑車輪がずれたゾイ
98: 02/11/02 15:20 ID:Jwe6TBuD(1) AAS
ウマー
99(2): Windows における namazu w/chasen 02/11/03 10:47 ID:rQsphwgx(1/2) AAS
Chasen を使ったインデックス作成が出来ません
外部リンク[html]:www.namazu.org
外部リンク[html]:www.namazu.org
外部リンク[html]:www.namazu.org
を見ると、2001/05 時点で chasen を使ったインデックス作成は
cygwin 環境で行うことができるようですが、
現在も chasen を使おうとすると cygwin 上で行うのが妥当でしょうか?
100: Windows における namazu w/chasen 02/11/03 11:17 ID:??? AAS
>>99
Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。
101: Windows における namazu w/chasen 02/11/03 11:33 ID:??? AAS
Namazu 2.0.12 は cygwin 上で問題なくコンパイルできました。
cygwin のデフォルトの perl 関連のパッケージでは File::MMagic はインストールされないので、
CPAN 外部リンク:search.cpan.org からダウンロードしてきて
あらかじめ (configure の前に) インストールしておく必要があります。
102: Windows における namazu w/chasen 02/11/03 14:10 ID:rQsphwgx(2/2) AAS
namazu + chasen は cygwin で 問題なく動きました。
cygwin のコアDLLのバージョンは 1.3.14-1 です。
103: 02/11/03 23:09 ID:sdt4YScv(1) AAS
>>99
全部cygwinでやる方法以外無いのでは?
そもそもkakasiを使う事が推奨されていて。
茶筅は結構イレギュラーな方法なわけだし。
(運用上結構問題がある)
104: 02/12/03 00:32 ID:??? AAS
ウマー
105(1): 02/12/26 00:21 ID:DUegdvZH(1/3) AAS
namazuを2chのdat形式に対応させようとしている人っていますか?
形式自体はレス1つが1行になっているだけなんだけど、<a name="hoge">をつけるのもなんか違う気がするし。
ファイル名と行数だけ教えてくればそれでよいんですが。
Namazuでやっているようなこと、ChaSenで分かち書きしてインデックス作ってcgiで検索っていうのも作りかけたけど、
車輪の再発明になりそうで中断してる。
106(1): 02/12/26 00:41 ID:M1+zinp+(1/2) AAS
>>105
dat からそのままインデックスを作りたいってこと?
mknmz 用のフィルタを書けばいいだけだよね。
perl だし結構簡単そうだね。
107(2): 02/12/26 01:19 ID:DUegdvZH(2/3) AAS
>>106
そのとおりっす。
各行の先頭に<a name="スレ番号"></a>入れて、理由は不明ですが、先頭行に適当に<html>とか入れてあげて、
mknmz --html-split -a hogohoge.dat
でインデックスは作れたし、検索もできるのは分かるのですが、
mknmzのソースのprocess_file辺りを見ると、コメントに、FIXME: Very complicated.とあるくらいなんで、めんどいなと。
html向けには分割して処理してるみたいですし。
誰か同じようなこと考えていないかなと。
108(1): 02/12/26 01:48 ID:M1+zinp+(2/2) AAS
>>107
read.cgi が出力する html をインデックスするよりも、
dat から直にインデックスする方がきっと速い。
いちいち dat から html 作らないから、不要なファイルを作らなくてもよい。
html として出力するのは 2ch ビューアとか、read.cgi に一任できる。
利点はこのあたりかな。みみずんとか喜びそうだよね。
結局、mknmz の仕様に則ったフィルタを作ればいい。
html.pl とか参考にして作ってみたら?
外部リンク[pl]:cvs.namazu.org
もし実現できたら、cvs にある scheme/http.pl と組み合わせて、
2ch.net の dat を直接インデックスできるかな。
あ、今 2ch.net は dat 直読みできないんだっけ? だめか。
109(1): 02/12/26 02:05 ID:DUegdvZH(3/3) AAS
>>108
フィルタ自体はHTMLのでも十分なんですよ。
--html-splitなしでは、mknmzってファイル単位でしかインデックス作らないじゃないですか。
datってスレ毎で、全レスが入っているから、スレごとにしか検索できないことになってマズーなのです。
p2 ( 2chスレ:mac )のdatを2次利用したいなと思っていろいろ試してます。
>>107 に書いたように、mknmzのprocess_fileあたりの--html-split処理部を書き換えてみてます。
110: 03/01/02 18:30 ID:cP1MLYPA(1) AAS
>>109
--html-split的なファイル分割を実現している人がいます。
本家には全く取り込まれていませんが…
Emacsのinfoファイルの分割(X-ml-name: namazu-devel-ja X-mail-count: 02059 )
外部リンク[html]:www.namazu.org
PDFファイルをページごとに分割(X-ml-name: namazu-devel-ja X-mail-count: 01951)
外部リンク[html]:www.namazu.org
つーかどちらも実装したのは僕ですが…
実現は単純だと思います。
行ごとにsplitするだけでとりあえずは実装できると思います。
見やすいようにフィールド情報を与えるためにはちょっと工夫がいるかもしれません。
ただフィールド情報が無くても十分有用だと思います。
そのページだけじゃわかりづらいと思うのでわからなかったら質問してください。
navi2chやら他の2ちゃんねるブラウザと連携すれば便利かもしれません。
ある特定のスレだけを検索対象にしてwebに公開しても便利かもしれません。
111(4): 03/01/03 09:06 ID:??? AAS
管理の都合上、
すべてのページについて、php4とpostgresを使っていて、
URLは 外部リンク:domain.com の形式で作ってるんですが
(fooとbarはいろいろ変わる&postgresでページの階層構造を管理してる)
これにNamazuを導入するには、どうすればいいんでしょうか・・・?
112: 03/01/03 09:29 ID:v/h8n2uJ(1) AAS
113(2): 111 03/01/03 18:29 ID:lPX3I1sa(1) AAS
あーれー、レスがない。
114: 03/01/03 18:42 ID:??? AAS
>>113
そういうこと書くと逆効果。大体お正月で人いないし。
そうだなあ、来週の金曜までにレスが無かったら、私がレスするよ。
115: 03/01/03 18:49 ID:??? AAS
>>113
この板でたかだか9時間くらいで何をいってるんだか。
再来週の木曜日までにレスがなかったら俺がレスするよ。
116: 111 03/01/04 00:23 ID:U6dtWDEb(1) AAS
とりあえず、それまでに、自学でなんとかできるかできないかなでの段階に、
・・・いきたいな
117: 111 03/01/04 19:17 ID:BatkqzbV(1) AAS
検索にひっかからない。。。
「php namazu インデクサ」とじゃ
「php namazu シェルスクリプト」とかで検索してるんだけど、
いまいち該当しない。
検索のヒント、ください。
118: 111 03/01/11 17:11 ID:CeP+V+mb(1) AAS
ショボーン
119(1): 03/01/11 18:22 ID:8y79ZXZ4(1) AAS
namazuかぁ。
ひらがなとかカタカナのもうめちゃくちゃな弱ささえ克服できればなぁ。
kakasiにひらがな単語の辞書登録さえあれば…。
もともと、そーゆープログラムではないから
AQに採用されることないけど。
120: 山崎渉 [(^^)sage] 03/01/15 13:33 ID:??? AAS
(^^)
121: 03/01/17 16:56 ID:TsHzDgv8(1) AAS
>>119
茶筅にしる!
122(2): 03/01/18 02:26 ID:??? AAS
Googleみたいにヒットした単語の周囲の文章をサマリ表示させてほしい。
サマリは直接生成。
123(1): 03/01/18 07:01 ID:0IdKnMy1(1) AAS
ところで、ウチのプロバイダはCGI使えないんだけど、全文検索(Namazuじゃなくても可)できる方法ないですかね。
124(1): 03/01/18 15:04 ID:??? AAS
>>123
あらかじめ検索用のインデックスを作っておいて、javascriptで、〜〜〜〜
125: 124 03/01/18 15:07 ID:??? AAS
よく考えたら、自分の所でCGI使えなくても、
CGIを使えるサーバーを借りたら、解決だった。
126: 03/01/18 16:10 ID:??? AAS
>>122
pnamazuつかえ
127: 03/01/18 22:45 ID:KC3+f7J6(1) AAS
>>122
自分的にもそれは必須の機能だと思うんだけどなぁ。
頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。
メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。
上下前次1-新書関写板覧索設栞歴
あと 248 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.573s*