namazuでサーバーを立てたい (481レス)
1-

1
(25): 名無しさん@ディストリいっぱい 2001/05/07(月)05:02 AAS
この板の過去ログを検索したくても不便です。
そこでnamazuを使って検索用のサーバーを立てようと思います。みんなのために。
namazuのインストールは終了しました。動作もばっちりです。
ただログを収集するのが大変です。
自動的にログを収集してくれるスクリプトってないですか?
っていうかそんなの持ってる人いたらください。
あと
外部リンク:cocoa.2ch.net
↑ここからログを拾うとdatファイル形式なのでhtmlで表示されません。
ログはどこから拾ってくればいいんでしょうか?
省1
2
(1): 名無しさん@ディストリいっぱい 2001/05/07(月)05:07 AAS
外部リンク:cocoa.2ch.net
↑ここにもちょっと過去ログがあるのは知ってます。
ここのはhtmlで保存されているのでいいんですがdatファイルは・・
datファイルをhtmlファイルに一気にコンバートするツールってあったっけ?
3
(1): 名無しさん@お腹いっぱい。 [sage ] 2001/05/07(月)05:09 AAS
なければつくる
4
(1): 名無しさん@ディストリいっぱい 2001/05/07(月)05:14 AAS
外部リンク:members.tripod.co.jp
調べてたらあったや。dat→html

あとは自動的にログを収集してくれればいいんだな。
って、ログを自動収集することが可能でもコンバートは自動的にやってくれないや・・
5
(1): 名無しさん@お腹いっぱい。 2001/05/07(月)05:24 AAS
wget -r -k -np -l 2 外部リンク:cocoa.2ch.net
dat->html
なシェルスクリプト書いて、cronかatの定時処理で取得では
だめなのかな。
6: 名無しさん@お腹いっぱい。 2001/05/07(月)11:32 AAS
>>2 >>5 に示された過去ログ倉庫には、ある程度時間のたったものしか
入らないので、新鮮な index ができない。よって、>>1 の示した
dat ファイルから直接拾うのが吉。それは、>>1 も分かっていることと
思う。

あとは、作成された index を、.namazurc にて URL 置換するときに、
工夫が必要。>>1 から拾うと、
$namazudir/2chスレ:linux
といったようなディレクトリに index が保存されることになる。
これを、REPLACE文で
外部リンク[cgi]:cocoa.2ch.net
省10
7: 名無しさん@お腹いっぱい。 2001/05/07(月)11:33 AAS
>>3
そりゃそうなんだけど、せっかくlinux板のための建設的な意見を
出してくれているんだから、なければおまえがつくれ、ではなくて、
ここでみんなでスクリプトを作っちゃえ!というくらいの勢いが
あってもいいかもしれない。
8: 名無しさん@お腹いっぱい。 [sage ] 2001/05/07(月)11:34 AAS
応援age
9: 名無しさん@お腹いっぱい。 2001/05/07(月)11:35 AAS
agaってなかった、、再age
10
(1): 名無しさん@お腹いっぱい。 2001/05/07(月)11:38 AAS
>>4
まさか、収集するのは Windows のマシンではないだろうから、
そのソフトを使うのは無理では。shell とか C とか perl
とか、なんでもいいけど普通にスクリプトで動かせる dat2html
って、まだ誰も作ってないのかな。

誰かつくりません?
11
(3): 名無しさん@お腹いっぱい。 2001/05/07(月)11:49 AAS
datファイルから直接 index を作成するためには、

1. 外部リンク:cocoa.2ch.net から dat ファイルを拾う
2. 1. で拾ったファイルを、***.dat といったファイルから
 *** というファイル (.html はいらない)へ、dat2html で
html 変換する(別ディレクトリへ)
3. 変換されたファイルに対して、mknmz
4. その index から、.namazurc にて
 REPLACE REPLACE $indexdir/ 外部リンク[cgi]:cocoa.2ch.net
 といった変換をすればよい

過去ログ倉庫から index を作成するのは、そのまま wget,
省4
12: 名無しさん@お腹いっぱい。 2001/05/07(月)12:00 AAS
super age
13
(2): 名無しさん@お腹いっぱい。 2001/05/07(月)12:36 AAS
>>10
実際、ここでログを過去ログ倉庫送りする際に、dat2htmlスクリプトを
使っているはずなので、2chのサーバーのどこかに dat2html が存在して
いることはたしかです。それがどこにも公開されていないとすれば、
プログラムがある程度できる人ならばそんなに難しいスクリプトでは
ないでしょうから、作ってしまった方がいいかもしれませんね。

誰か、dat2htmlを作ってここに書きこんでくださる方はいませんか。
14
(4): 名無しさん@お腹いっぱい。 [sage ] 2001/05/07(月)12:57 AAS
適当だが>>13
$cnt=1;
# ここで適当なHTMLヘッダを出す
$fff=shift;
open(TH,$fff) || die "open error\n";
$_=<TH>;
chop $_;
$num=@dat=split(',',$_);
print "<title>".$dat[4]."</title>\n";
print '</HEAD>'."\n";
省17
15: 名無しさん@お腹いっぱい。 2001/05/07(月)13:02 AAS
>>14 age
16: 名無しさん@お腹いっぱい。 2001/05/07(月)13:45 AAS
age
17
(2): 名無しさん@お腹いっぱい。 [sage ] 2001/05/07(月)13:57 AAS
>>13
,が余計にあると混乱するみたい
18: 名無しさん@お腹いっぱい。 [sage ] 2001/05/07(月)14:02 AAS
namazuの開発が沼津で行われてたってのは実話?
19
(1): 名無しさん@お腹いっぱい。 2001/05/07(月)14:06 AAS
支障のオナニースレと三流大スレとrh叩きスレの下にあるのは言語道断。
この板で今生きている唯一の良スレだ。常に上にあるべき。age
20
(2): 14 [sage ] 2001/05/07(月)14:26 AAS
>>17
その辺は修正してくれ、10分で書いたやつだからと言い訳
21
(1): 名無しさん@お腹いっぱい。 2001/05/07(月)14:47 AAS
テストランしてないけど、

#!/bin/sh

export dat2html=/usr/local/bin/dat2html.pl
export workdir=/home/2ch
export wgetdir=$workdir/wget
export datdir=$wgetdir/linux/dat
export namazudir=$workdir/namazu

cd $wgetdir
wget -m -I linux/dat 外部リンク:cocoa.2ch.net
for i in `ls $datdir`
省8
1-
あと 460 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.033s