namazuでサーバーを立てたい (481レス)
1-

267
(1): 247 2001/07/13(金)00:19 AAS
>>266 どうもです。
「MOGURA」検索後(result)のレイアウトがいいですね。
この辺り参考にさせて頂きたいです。
後は見やすい配色を考えて..。(寝
268: login:ディストリいっぱい 2001/07/13(金)01:49 AAS
>>265さん
ああぁ。すみません。
前に聞かれた時には全然増やす気はなかったんですけどこのあいだ大先生の検索が
使えなくなってたのでそのフォローのつもりで一気に検索対象板を増やしちゃいました。

>>267さん
ということはー。僕のところは見にくい配色だと言うことですね・・・へ・へこーん。
269: このスレ最初っから見てたけど 2001/07/13(金)17:50 AAS
ひさしぶりに見たけどすげぇ
改めて使うと便利便利
運営ガンバレよ
270: 247 2001/07/13(金)17:54 AAS
>僕のところは見にくい配色
いや〜ちゃいます...今テストしているページの配色が悪くて見づらいので
どうにかしようと考え中なところなんです。

wgetを使っていて、ファイル数が多い所からのダウンロードをすると
急に動作が遅くなり、通常ならメモリ消費がコンスタントに1MBぐらいのところ
20〜30MBも食いバグかな?と思わせる動きをしますね。
バージョン1.6、1.7を試した限りでは同じ症状。
この時1つ1つのファイルサイズが小さくても関係ないので
メモリ回りのバグなのか・・・。

同じ相手サーバー内でもファイル数の少ないディレクトリなら全然問題無いので
省1
271: [uge] 2001/07/16(月)15:42 AAS
age
272
(10): 2001/07/21(土)22:57 AAS
namazu ベースの2チャンネル検索サイト
試験的に公開します。
まだ、不都合があるかもしれないので気が付いたら指摘してください。

外部リンク:www12.tok2.com
273: Anonymous 2001/07/21(土)23:22 AAS
ふむ、とくとくか・・・
色分けによりわかりやすいサイトだね。
274: 2001/07/21(土)23:30 AAS
心配だった配色が不評じゃなくてよかった...。

ページ構成がまだ、決まってないけどシンプルに
する予定です。
275
(1): 2001/07/21(土)23:34 AAS
綺麗でみやすい配色だと思います
276: 2001/07/22(日)00:08 AAS
>>275 どうもです。

使いやすいサイト目指してやってみます。
277: 2001/07/22(日)02:48 AAS
>>272
むぅ。うちの Netscape だと何も表示されん…
278: 2001/07/22(日)02:54 AAS
>>272
俺もリロードすると何も表示されなくなる。。。
279
(1): 2001/07/22(日)02:55 AAS
>>272
UNIX?
280: 272 2001/07/22(日)08:04 AAS
>>279 UNIXです。
文字コードかも。今日夕方に取り組みます。
281: 2001/07/22(日)09:04 AAS
文字コードだね。
<!--meta http-equiv="Content-Type" content="text/html; charset=euc"-->
コメントアウトしてちゃあ駄目だろ。。。
282: 2001/07/22(日)11:43 AAS
>>272
100点を取る必要はないけど(ほとんど不可能)
htmlの間違い探しに使ってください。

外部リンク:validator.w3.org
283: 272 2001/07/22(日)17:14 AAS
フリーのCGIが使える所は、どうも文字コードの問題が出ると何処かで見たので
今朝、x-sjis>euc>コメントアウトしてチェックしてみたけど・・・。

これから色々やってみます。
284: 272 2001/07/22(日)17:15 AAS
こんな書込みを上げてしまった。
285: 272 2001/07/22(日)19:54 AAS
ひとまず、使えるようになりました。

テスト公開中検索
外部リンク:www12.tok2.com

入り口のindex.htmlは、定期的にPerlで書き出しているのと
フリーサーバーの場合はそれを、#includeして広告を入れている?ので
手探りで文字コード指定しました。(笑
フレームタグのサイズ指定が、ブラウザによって解釈が違ったりするので
これもまた、手探り状態で色々設定してどうにかまともになりました。
286: 272 2001/07/22(日)23:54 AAS
文字化け対策でこんなのもあったけど
外部リンク[html]:www.yahoo.co.jp

今のところ問題無さそうなのでひとまず現状維持。
287: 272 2001/07/26(木)00:16 AAS
以前にタイムスタンプ引継ぎの事を書いたので
>>258 にタイムスタンプの引継ぎを入れると・・

wget -m -I linux/dat 外部リンク:cocoa.2ch.net
for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j

touch -r $datdir/$i $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j #タイムスタンプ引継ぎ

done

ディレクトリごと削除した時に効果あるかわかりませんがタイムスタンプが
以前にインデックスを作成した時と同じならmknmz 時にスキップしてくれるかも
省1
288: hanajan:特科連χ [河内のモッタイナイ屋だす〜♪] 2001/07/30(月)17:59 AAS
DNSの故障だったのか。。。
一昨日に検索窓を付けたモノでして。。。
外部リンク[htm]:www.hanajan.com
289: login:ディストリいっぱい 2001/07/31(火)01:56 AAS
あははー。検索窓ついてるー。使ってくれてる人がいるとは思わなかったです。ありがとうございます。

しかし 外部リンク:www.dyn.to って結構ポロポロサバ落ちするんだなあ。金取ってるくせして。
こんなんだったら最初から無料の 外部リンク:dyndns.org にすればよかったなあ。
金取ってる分だけ安定してるかと思ったのに。今さら変えるの大変だしなあ。
はあああ。ストレスたまるー。
あまりにもストレスがたまるので他のところに変えてやるーって思って探してたら
最近新しいのできたんですね。→ 外部リンク:ddo.jp ←誰か使ったことある人います?
試しに取ってみたけどどうだろう。1ヶ月全くオチないようだったらこのまま使ってもいいかなあ。
外部リンク:2ch.ddo.jp
でも年額6000円は高い。。。
290: hanajan:特科連χ [河内のモッタイナイ屋だす〜♪] 2001/07/31(火)03:46 AAS
ウットコ・・・
月額6000円程度でし・・・

外部リンク:www.hanajan.com
メインのWWWです。
そろそろ、フレーム付けっかな〜。。。
291: login:ディストリいっぱい 2001/07/31(火)12:12 AAS
うおっ。すごいもの見つけました。
昨日書いた 外部リンク:ddo.jp のサイトをうろうろチェックしてたら
外部リンク[php]:ddo.jp
↑「Linux@2ch掲示板」にリンクが張ってました!!!笑
そうだったんですね。僕たちの仲間だったんですね。水臭いではないですか。ddo.jpさん。
だったら推奨します。→ 外部リンク:ddo.jp ←素晴らしい
今のところ問題ないし、無料バージョンもあるし、ドメイン覚えやすいし。いいと思います。
Linux板住人価格として6000円を3000円にまけてくれるともっと素晴らしい。←ホメた目的はこれ

話変わりますけどこの板、最近書き込みがすごく減ってないですか? (@@;)
292: Anonymous 2001/07/31(火)13:08 AAS
事後報告だが、検索窓を張った
外部リンク[html]:www.geocities.co.jp

ジャンルは2ちゃんねる@UNIX板/Linux板(藁
293
(1): login:ディストリいっぱい 2001/07/31(火)13:34 AAS
あのにまうすさんも使ってくれてるんですね。ありがとうございます。

アップローダーがあったんでエロエロ画像がアップされているのを期待して
見てみたんですが全然違いました。。がっかりです。。。
アップローダ=エロエロ画像 と考える僕が間違ってますかー?(ーー;)
294: 2001/08/10(金)14:53 AAS
2.0.6 リリース age
295: 2001/08/10(金)20:54 AAS
>>293
心配するな俺もそう思ったよ。
296
(2): 2001/08/10(金)21:43 AAS
v2.0.6 早速導入しました。

●毎日更新
外部リンク:203.141.142.84
297: Anonymous ◆True/7Po 2001/08/15(水)16:11 AAS
>>296
事後報告、くだしつスレにリンク張りました
外部リンク[cgi]:cocoa.2ch.net
298: 296 2001/08/15(水)22:08 AAS
リンク有難う御座います。
高レスポンスで返せるようチューニングに励みます。
299: 2001/08/23(木)00:36 AAS
 
300: ◆EMrmvKLI 2001/08/23(木)05:31 AAS
(・∀・) 300!!
301
(1): 2001/08/25(土)18:10 AAS
久しぶりに2ch検索使ってみたらこの板で作ったなんてことは全部すっとんで
広告貼って小遣い稼ぎですか?
302: 2ch検索の"管理"人かも 2001/08/25(土)18:26 AAS
>>301
1円もお金なんか入ってきませんけど?
広告=管理人にお金が入る
と思ってはいけません。
広告を貼るから値引きをしてくれ、ということで広告が入ってます。
ちなみに前のコレガの時も広告を貼るから懸賞の商品を提供してくれ、
との条件でバナーを貼ってました。僕には何も入ってきてません。
外部リンク[html]:2ch.dyn.to
↑これね。

これらは、みんなに作ってもらったからみんなに対するお礼のつもりでやってます。
省1
303
(1): 余弦者 2001/08/25(土)23:01 AAS
>>1と他の検索サイト管理人殿

現在閉鎖中の板は2度と戻ってこないかもしれないので、
現在のログを保存してあとで公開してもらえると非常に助かるのだが
304: 2ch検索の管‎理人かも 2001/08/25(土)23:57 AAS
>>303
ああぁ、、、僕はログは捨ててます、、、
でもって「かなりしばらくお待ちください。」のところは
今となってはdatファイルを取ることもできません、、、
ですから僕には何もできません、、、すみません、、、
みみずんさんのところがログをちゃんと保存してるからなんとか
してくれるかもしんないです。
↓ココです。
外部リンク:mimizun.mine.nu
305: 2ch検索の管‎理人かも 2001/08/26(日)00:02 AAS
ちなみに他のところはと申しますと
外部リンク:203.141.142.84
外部リンク[htm]:64.124.197.202
こういう状態です、、、ああああ。
「壊滅状態」という言葉がぴったりの今日です、、、
306
(1): 2001/08/26(日)00:24 AAS
この手の検索システム構築には、マシンパワー&高速回線が必要だと思います。
データ取り込み時に圧迫される回線
インデックス書き出し時に消費されるCPUパワー
データ保存で必要なHDD領域
常時稼動によって掛かる電気代&騒音。
手間も掛かり決して楽なボランティアでは無いと思いますので
がんばってください。>各検索の管?理人
307
(2): hanajan@零号 ◆abdWn..Q [河内の物体χ屋です] 01/08/26 21:05 ID:lwjpwoTg(1) AAS
スレが見つかって、それを表示する場合、
"レス全部読む"ではなく"最新レス100"
のURLが指定できんかのぅ。。。
308
(1): ディストリがいっぱい 01/08/26 21:38 ID:iEaIYVak(1) AAS
>>306
お・応援ありがとうございます。が・頑張ります。

>>307
それ、いいですねえ。
ja.po かなんかをいじればできそうな気もします。
でも僕は ja.po というものがどこにあるのか知りません。ですから永遠に対応はできません。

さ・さようなら。。。ごめんなさい。。。
309: 検索エンジン全開 "管理"人 01/08/27 21:30 ID:06X1b0s6(1) AAS
人為的ミスでブレーカーを落としデータがクラッシュ、しばらく停止してましたがやっと復旧。
UPSは管理人の個人的財政難から今後も採用予定無し...

>>307 可能だと思いますが、検索キーワードでHitしたスレッド内を
ブラウザ検索で長い書込みの中から絞込みを想定しています。
現状でどうにか使って頂きたいと思います。
310: 01/09/05 01:36 ID:9/sH.COA(1) AAS
このスレの連中はシェルスクリプトもロクに書けねーのかよ。
export var=valは許すとして、
for i in `ls $datdir|egrep "[0-9]\.dat"`なんて痛すぎ。
ディレクトリ空だったら死ぬだろ。
昔の話題ではあるが。
311
(2): ディストリいっぱい 01/09/29 23:47 ID:gAs/Bj.E(1/4) AAS
今日発売のあちゃら11月号の91ページに2ちゃんねる検索が掲載されてます。
暇な人は見てみて下さい。
今月の初めにライターさんから「掲載させてもらいます。」という話は聞いていたけど
どういうふうに取り上げるのかは聞いてなかったんで、どんなふうに載ってるんだろ?
と思って立ち読みしようと思って本屋に行ったら結構大きく紹介されてたので
買ってしました。永久保存版。。。

今度の目標は日経Linuxに掲載されることです。頑張ります。
312
(1): 01/09/29 23:49 ID:gAs/Bj.E(2/4) AAS
おめでとう。
313
(1): 01/09/29 23:50 ID:gAs/Bj.E(3/4) AAS
名スレの予感 
314: ディストリいっぱい 01/09/29 23:51 ID:gAs/Bj.E(4/4) AAS
ちなみに >>312 >>313 は自分で書き込みました。
誰も反応してくれないとさみしいんで。。。
315: 01/09/30 00:06 ID:s8gsnkrQ(1) AAS
>>311
技術的なことはちんぷんかんぷんですが、
本当におめでとうございます。
316: ディストリいっぱい 01/09/30 00:14 ID:2uU1/ecY(1) AAS
あ、本当に祝ってもらえた。うれしいです。ありがとうございます。
317: 検索エンジン全開 01/10/05 00:07 ID:OyHoZWHc(1) AAS
>>311 おめでとうございます。
まだ見てないから見てみよ。
318
(1): うろんぐ 01/11/30 17:52 ID:0UsyWI7S(1) AAS
Web ページで検索できるようにする前に、emacs から検索してみようと思って namazu.el を入れてみた。

でも、M-x namazu で検索文字列を入れてみると
Wrong type argument: stringp, nil
と表示されて検索できなかった。

コマンドラインから namazu で検索するとちゃんと検索できてるのになぁ。

何が悪いのでしょうか? emacs-lisp を勉強していない俺が悪いのでしょうか?
319: みみずん 01/11/30 20:32 ID:8qsrn8Pr(1) AAS
最近、管理がめんどい。。。
過去ログ取得スクリプトにバグはあるしディスク障害もあるわで。

外部リンク:mimizun.mine.nu
320
(1): うろんぐ 01/12/01 08:49 ID:U6ZUKGfm(1) AAS
>318
自己レス。
~/.namazurc でのデフォルトのインデックス指定が

Index ほげ

だったのが敗因でした。

INDEX ほげ

じゃないとだめなんですね。いや、 namazu はどっちでもいいんですが、 namazu.el で .namazurc を解析するところが INDEX しか見てくれないんですよね。それだけでした。スマソ。
321
(2): 01/12/07 17:50 ID:QGAXIRf/(1) AAS
Namazuはクズ検索エンジン
322: 01/12/07 20:45 ID:+fpiRIvO(1) AAS
>321
何がおすすめ?
合計 20GB 程度の Web サイト内の全文検索をしたい。
323
(1): 01/12/08 11:15 ID:AvJQP9li(1) AAS
Mitake Search なりなんなりの売り物つかうのはどうよ。

>>321 は例の私怨厨か... まだいたんだな。
324: 01/12/13 11:18 ID:ugaubRPB(1) AAS
>323
なるほど、と思っていろいろ商用のものを見てみたんですが、
きづいたこと。
Namazu をつかってて、致命的に困っていることが、無い。
というわけで Namazu を使いつづけることにしました。
Debian 用パッケージも用意されていることだし。
325: あのみみずん@ N72ch-01p57.ppp11.odn.ad.jp 01/12/16 09:46 ID:dwyzpYXY(1) AAS
Namazu いいよね。便利だし、早いし。
まぁ検索精度は低く感じるけど無料だから文句ないし。

つか、index作るのに時間かかるね・・・メモリも食うし。
326: 01/12/18 00:35 ID:xpsT3a/l(1) AAS
申し訳程度にrenice +20…
327
(1): 02/01/26 16:50 ID:7jfLsj9S(1/2) AAS
kakasi の辞書、mysql とかのデータベースに格納できるとありがたいんだけどなぁ。
328: 02/01/26 21:15 ID:7jfLsj9S(2/2) AAS
DocuWorks 文書用のフィルタってどなたかしりませんか?

昨年10月ごろの ML で Fuji Xerox の開発部でも UNIX 用のフィルタの必要性は認識しているって言う話がでてたらしいんですが、その後まったく話を聞きません。
329: 02/01/26 21:30 ID:UX7CiKAA(1) AAS
広報にたずねてみては?
個人でも邪険にされることはありませんよ
330
(1): 02/01/26 22:35 ID:cUpXDNAM(1) AAS
>>327
それ、ずーっと昔に試したことがあるけど、かなり遅いよ(汗
postgresでもmysqlでもoracleでもsybaseでも。

データ型のチェックとか格納のためのソートツリーの作成とか、
kakasiを使うにあたって不要な部分がボトルネックになる模様。
331: 02/01/27 00:49 ID:rUkqU65a(1/2) AAS
>330
それって、kakasi のソースをいじってってことですか?
それとも毎回データベースから単語ファイルを作成して辞書ファイルを作成して…ってことですか?

もしかして前者の場合だったらパッチがあるとか…。
332: 02/01/27 05:51 ID:rUkqU65a(2/2) AAS
>320
なんか久しぶりにこのスレ読んで、おもだしたので、BTS にあげときました。
333: 02/02/09 12:34 ID:QOH+2g3Z(1) AAS
1からよんで感動した
334
(1): 02/03/08 14:10 ID:OE9ed93x(1) AAS
wvWare v0.5.x.tar.gz どっかに無いかな。
v0.6以降からおいらのスキルじゃWord文章をうまく検索できんようになってしまった。
335: 02/03/08 17:16 ID:2E3LNJfK(1) AAS
>>334
CVS から最新のフィルタだけ持ってきたらどうですかね。
外部リンク[pl]:cvs.namazu.org
336: 02/03/24 00:16 ID:ECEITlSW(1) AAS
age
337: 02/05/01 23:10 ID:vlGgka0t(1) AAS
 
338
(1): 名無しさん@ディストリいっぱい 02/05/04 01:19 ID:sJTSZgK7(1/2) AAS
なんと早くも1周年。おめでたいです。
よく頑張りました。(自画自賛)
339: 02/05/04 01:28 ID:rn7+GErz(1/2) AAS
>>338
コテハンはひさしぶりだな。
掲示板すごいことになってるね。
340: 名無しさん@ディストリいっぱい 02/05/04 01:39 ID:sJTSZgK7(2/2) AAS
すごいことになってるっていうから荒らしでも来てるのかと思って見に行っちゃいました、、
あの質問づくしのことですか?もう慣れました。メールでも「削除して下さい。」とか
「書き込みができないんですけどなんでですか?」ってメールがしょっちゅうきます。
わかる範囲で答えてますけど。

1年ってあっという間だなあとしみじみとした気分です。
341: [age] 02/05/04 07:09 ID:vsdupTed(1/2) AAS
アーリーらっぱ飲みしながら>1から読破。
知らずに使っていた2ch検索にこんな歴史があったなんてね。
342
(1): あれれ? [age] 02/05/04 07:12 ID:vsdupTed(2/2) AAS
空欄にしたら「名前:login:Penguin」になってしまいました。
詐称ではありませぬ。
343: 02/05/04 08:44 ID:rn7+GErz(2/2) AAS
>>342
それは「名無し」だ。
外部リンク[html]:freezone.kakiko.com
344
(1): 02/07/19 22:06 ID:SLbxrvZg(1) AAS
UNIX板から来ました。

"namazu.cgi"を間違って消してしまいました。今から使おうと思ったのに

redhat7.3のrpmから入れたやつです。ちなみにバージョンは
namazu-2.0.10-4
namazu-cgi-2.0.10-4
だれかアップしていただけると助かります。お願いします。
345: hh 02/07/19 23:15 ID:6iM25OVn(1) AAS
外部リンク[html]:freehome.kakiko.com
346: 02/07/19 23:23 ID:W906XYYp(1) AAS
これ?
外部リンク[cgi]:2ken.net
347: 02/07/20 01:05 ID:RZHWY+0C(1) AAS
>>344
いったん rpm 消して入れ直せば?
348: 02/07/20 22:52 ID:JNErfAQQ(1) AAS
大抵はつかえるだろう。
349
(1): 02/07/26 10:44 ID:5MbssHQh(1) AAS
にちゃんねる検索はいいと思うんだけど、
自宅でサーバー立ててる人とかってさー
namazu何に使ってんの?
なんかおもしろい使い方ってある?
350
(1): 名無しさん@Emacs 02/07/26 11:24 ID:QxusWSJk(1) AAS
>>349
日記検索
351: 02/09/04 13:04 ID:+A/E5ACP(1) AAS
感謝age
352: 02/09/04 14:15 ID:RLmpKL5P(1) AAS
>>350
DBですれ。
353: 02/09/22 12:59 ID:nEa4cqUa(1) AAS
つか/settei/がIndex表示になってないな。
shスクリプトとか欲しいのに。
354: 02/09/22 13:13 ID:N4s7ITei(1) AAS
2ch.shだと思ってたが名前変更されてたんだな。俺もちょっと探したけど見つけた。
外部リンク[sh]:2ken.net
これだろう。でもわざわざこれを取得しなくてもこのスレに書かれてるのと同じだと思うが。
但し、今はdatディレクトリが見れないからこれでは動作しないと思う。
あと3行目の set | grep LANG は不要だと思う。ここでgrepしてどうする・・
355: 名無しさん@Emacs 02/10/03 02:45 ID:tCrncUsf(1) AAS
/usr/lib/mozilla/searchplugin/Googlejapan.src に
ちょっと変えてこんなんを作ってみた。

# Mozilla/2chSearch plugin
<search
name="2ch search"
description="2ch search"
method="GET"
action="外部リンク[cgi]:2ch.dyn.to"
queryEncoding="2561"
省17
356
(2): 02/11/01 10:53 ID:SkScjhB+(1/3) AAS
インデックスから日本語を排除したいと思っています。

検索対象は日本語のテキストファイル(含む LaTeX ソース、メール、ニュース)なのですが、
検索後として日本語を指定することがほとんどありません。
そこでインデックスを作る際に日本語は省いてしまいたいと思っています。
mknmzrc はどのように設定するといいのでしょうか?

現在は kakasi, chasen 共に使用できるようになっています。

あと、メールやニュースの Message-ID, In-Reply-To, References: フィールド以下の
文字列に対しては、メッセージ ID そのままの状態でインデックスに含めたいのですが、
可能でしょうか?

つまり、検索文字列としてメッセージIDを指定したいことがあるということです。
357: 356 02/11/01 11:31 ID:SkScjhB+(2/3) AAS
nkf ~/Mail/ML/IETF/1 | chasen -j -F '%?U/%m/ / ' | jless

で望む結果が得られ多っぽいです。
chasen のマニュアルによると

         %?U/STR1/STR2/

っての 『if unknown word, STR1, otherwise, STR2』 ってことなのですが、
UNKNOWN ってのは辞書に無いってことですよね?
てことは chasen の辞書に英単語が載っていたらだめなんだな。
358: 356 02/11/01 11:32 ID:SkScjhB+(3/3) AAS
nkf ってデフォルトで BASE64 のデコードしてくれるんですね。
メールの Subject: の日本語(BASE64エンコードされている) が、
デコードされててちょっと感動した。
359: 独自フィルタを作りたい 02/11/02 12:11 ID:0CRm6865(1/7) AAS
Namazu文書フィルタの作成方法
〜 Namazu 2.0 用 〜
外部リンク[txt]:www.namazu.org

ほかに参考になるサイトはありますでしょうか?
360: 独自フィルタを作りたい 02/11/02 12:19 ID:0CRm6865(2/7) AAS
特にフィールド検索に重点をおきたいと思っています。

実験結果のファイルがあって、それには実験の条件が書き込まれているので、
Word や Excel 文書の「文書のプロパティ」みたいな扱いができればと。

使用している OS は Debian GNU/Linux 3.0 (woody) です。

いくつかのフィルタを読んでみたところ、フィルタの側ではとにかく可能な限り、
フィールドの情報を抽出して返しているように思います。
フィールド名などもフィルタのほうで勝手にいくらでも作ることができるみたいです。

どのフィールドをインデックスに採用するかというのは、
フィルタから返された情報を見て mknmz が決定するのでしょうか?
361: 独自フィルタを作りたい 02/11/02 12:25 ID:0CRm6865(3/7) AAS
つまり、"+subject:linux" みたいな検索式の subject の部分に何を使えるかは、
誰がどうやっていつ指定しているか、ってことなんですが。
362: 独自フィルタを作りたい 02/11/02 12:35 ID:0CRm6865(4/7) AAS
REMAIN_HEADER vs SEARCH_FIELD
外部リンク[html]:www.namazu.org

全文検索 Namazu 講座
外部リンク[html]:www.rfs.jp

$REMAIN_HEADER
   RFC 822 Header などのうち本文として検索出来るものを指定
$SEARCH_FIELD
   フィールド検索(「+subject: 検索語」のような形式)に使える項目を指定する
$META_TAGS
   検索対象にするMETAタグを指定
省4
363: 独自フィルタを作りたい [漏れの日記みたいでごめんね sage] 02/11/02 12:45 ID:0CRm6865(5/7) AAS
フィルタ読んでみました。

$REMAIN_HEADER → mailnews.pl が見ている
$META_TAGS → html.pl が見ている

$SEARCH_FIELD と %FIELD_ALIASES は mknmz 本体だけが見ている?
(まぁ conf.pl でデフォルト値を設定しているのは別として)

うむ〜 NMZ.field.* 出力している部分をよんでみまつ・・・
364: 独自フィルタを作りたい [漏れの日記みたいでごめんね sage] 02/11/02 15:33 ID:0CRm6865(6/7) AAS
1)フィルタからフィールドのデータが連想配列で返ってくる。

2)%FIELD_ALIASES を使ってフィールド名を変換
  %FIELD_ALIASES は
  キー = フィルタから返ってくるフィールド名
  値 = インデックスに登録するときのフィールド名

3)フィールド名が SEARCH_FIELD にあるものは NMZ.field.<フィールド名> に出力
  META_TAGS を使うようオプションで指定されていたときは
  SEARCH_FIELD だけでなく META_TAGS にあるものも対象。

ってことか・・・・ちょっと気持ち悪いのは、なぜか mailnews.pl では
メールヘッダの Subject: の内容を 'title' フィールドとして返しておいて、
省2
365: 独自フィルタを作りたい 02/11/02 15:35 ID:0CRm6865(7/7) AAS
今朝になって突発的に独自フィルタ作りたくなって、
my とか local ってなに?
perl の名前空間ってどうなってんの?
@ とか % とか \ とか $ とかなに?
ってとこからはじめたんで、ちゃんとソース読めてないかもしれない・・・
366: 02/11/03 02:13 ID:RjWYQ8zV(1/2) AAS
Windows の Outlook の *.msg ファイルがあるんですが、
これのフォーマット分かる方おられませんか?
フィルタかいてみようかとおもったんですが、
MH 形式とはちょっと違うみたいです。
いらないバイナリデータがあちこちにちりばめられていて。
確かにテキスト部分は一部読めるんですが。
1-
あと 115 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.040s