[過去ログ] 関連キーワードをなんとかしようスレ (518レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1
(1): ひろゆき@どうやら管理人 ★ 2006/12/17(日) 13:08:47 ID:???0 BE AAS
read.cgiの片隅に表示されている関連キーワードを
きちんとメンテナンスしてみようなスレッド。
392: 讃岐フォアンフォアン▲ ◆SANUKI/VII 2007/02/16(金) 10:51:18 ID:Gnp6zGs8O携(1)調 AAS
textでA B C D Eだけにしてよ

html解析めんどい
393: 動け動けウゴウゴ2ちゃんねる 2007/02/16(金) 11:07:20 ID:X0vKb2di0(1)調 AAS
おいおい、XMLのパースもできないのかよw
394: 株価【1200】◆cZfSunOs.U 2007/02/16(金) 11:25:00 ID:cIKZ8NCe0(2/3)調 AAS
データのパースをするなら,個人的には JavaScript 版の方がおすすめです.
外部リンク[cgi]:p2.2ch.io

var keywords = { "keyword1":"encodedKeyword1", "keyword2":"encodedKeyword2", ... };

の行だけ抜き出して,他の行は捨てる.で,キーワードの中には記号が
入ることはないので,単純に , や : でちょん切って前後の " を消せばおk.
395: ◆SANUKI/VII 2007/02/16(金) 11:32:53 ID:SrcEbV7/P(1/2)調 BE AAS
その作業がめんどい
396: 株価【1200】◆cZfSunOs.U 2007/02/16(金) 11:58:54 ID:cIKZ8NCe0(3/3)調 AAS
Perl ならこんな感じじゃ?

sub extract_keywords {
    my @kw;
    $_[0] =~ /^var keywords = { ((?:"[^"]+":"[^"]+"(?:, )?)+) };$/m
        or return;
    foreach (split(/, /, $1)) {
        /^"([^"]+)":/ or next;
        push(@kw, $1);
    }
    @kw;
}
397: ◆SANUKI/VII 2007/02/16(金) 12:00:41 ID:SrcEbV7/P(2/2)調 BE AAS
わがままいったのにやさしくしてくれるsunosさん好き
398: 動け動けウゴウゴ2ちゃんねる 2007/02/16(金) 12:01:02 ID:LpEtGD2H0(2/2)調 AAS
すのす
399
(1): 動け動けウゴウゴ2ちゃんねる 2007/02/16(金) 14:14:03 ID:Gv2LZx+i0(1)調 AAS
これと同じようなインターフェースでおすすめ2ちゃんねるも呼び出せるようにしてほしい。
400: 動け動けウゴウゴ2ちゃんねる 2007/02/17(土) 12:51:34 ID:rbTTlVzI0(1)調 AAS
まろゆき、振り込んでこいさっさと。鯖は俺の鯖を貸してやる
401
(1): 株価【1290】◆cZfSunOs.U 2007/02/17(土) 13:42:48 ID:tFdnFmdq0(1/3)調 AAS
>>399 外部リンク[html]:qb5.2ch.net

read.js が動いてる鯖ではこんな I/F もありますが......
外部リンク[so]:life8.2ch.net
402: 動け動けウゴウゴ2ちゃんねる 2007/02/17(土) 15:55:07 ID:hVA6QFAM0(1)調 AAS
>>401
おお。
下の奴しか知らなかったので、上でやってみる。
403
(1): 動け動けウゴウゴ2ちゃんねる 2007/02/17(土) 21:49:44 ID:RVm512sw0(1)調 AAS
>>385
今は直ってるみたい
そのときは二文字のが一文字だけになったり後ろが化けたりしてた
404: 株価【1290】◆cZfSunOs.U 2007/02/17(土) 22:16:36 ID:tFdnFmdq0(2/3)調 AAS
>>403 そうですか...... MySQL は cp932 で動いてるし,ヘンなバイトシーケンスが
そのまますり抜けるってことはないとは思いますが,またあったら知らせて下さい.
405: 株価【1290】◆cZfSunOs.U 2007/02/17(土) 22:53:35 ID:tFdnFmdq0(3/3)調 AAS
あ......ひょっとして↓を入れないとデータ化けが起こる可能性もなきにしもあらず?
静かな時間帯にでも入れ替えておこう<DBD::mysql

--- DBD-mysql-4.001/dbdimp.c
+++ DBD-mysql-4.001/dbdimp.c
@@ -3750,19 +3773,11 @@
                  "Error happened while tried to clean up stmt",NULL);
         return 0;
       }
+      /* to avoid SIGSEGV when reusing this statement handle */
+      imp_sth->stmt->bind_result_done= 0;
     }
(ry

# これも含めパッチ投げて反応待ちだったり.
# 外部リンク[php]:bugs.mysql.com
406
(2): 動け動けウゴウゴ2ちゃんねる 2007/02/18(日) 22:01:39 ID:qfY4A8BA0(1)調 AAS
さっそく
外部リンク[cgi]:p2.2ch.io
マラソンをクリックするとこれに
外部リンク:find.2ch.net
407
(1): stream ◆PNstream2s 2007/02/18(日) 22:09:21 ID:XzsEMgbQ0(1/3)調 AAS
>>406
2ch検索側がおかしいと思う
408
(1): stream ◆PNstream2s 2007/02/18(日) 22:13:20 ID:XzsEMgbQ0(2/3)調 AAS
%83%7D マ
%83%89 ラ
%83%5C ソ
%83%93 ン

%5C \

%83%83 ャ
409
(1): 動け動けウゴウゴ2ちゃんねる 2007/02/18(日) 22:19:53 ID:ZJ8NfgfI0(1/3)調 AAS
>>406-408
外部リンク:find.2ch.net のPerlスクリプトの正規表現マッチさせてるところに \Q いれれば解決
410: 動け動けウゴウゴ2ちゃんねる 2007/02/18(日) 22:33:55 ID:ZJ8NfgfI0(2/3)調 AAS
>>409
URIいじってみたけど、少し違ってたみたい。
getf.cgi で %5C をふたつ重ねるようにすればいいのかな?<こちらは動作確認
外部リンク:find.2ch.net
411
(1): stream ◆PNstream2s 2007/02/18(日) 22:51:03 ID:XzsEMgbQ0(3/3)調 AAS
%5Cを重ねればいいんだろうけど、そもそも find.2ch.net の中を直さなきゃ。
412
(2): 動け動けウゴウゴ2ちゃんねる 2007/02/18(日) 22:59:08 ID:ZJ8NfgfI0(3/3)調 AAS
>>411
find.2ch.net の方は EUC で処理してるっぽいのに、getf.cgi の出力が SHIFT_JIS で
発行されてる部分が多分食い違いの原因。
気を使うべき正規表現を扱ってる find.2ch.net の中を修正するのが筋なのは確かかも
413: 動け動けウゴウゴ2ちゃんねる 2007/02/19(月) 00:38:36 ID:Qm35+Bmi0(1)調 AAS
>>290に回す
414: なぽ 2007/02/19(月) 02:07:40 ID:KxOYQz7X0(1)調 BE AAS
>>412
修正しますた。
エンコーディング変換前になぜかstripslashes()が。なんでだろ。
415: 動け動けウゴウゴ2ちゃんねる 2007/02/19(月) 08:46:54 ID:kfF0dg9s0(1)調 AAS
>>412
もう解決してるっぽいけど、Shift_JISの2バイト目のバックスラッシュの取り扱いの問題だね。
データのエンコーディングの扱いが曖昧だとハマる。
416: 動け動けウゴウゴ2ちゃんねる 2007/02/19(月) 08:57:09 ID:dFaVY2iE0(1)調 AAS
stripslashes ってことはPHPなのかな?
PerlでShift_JISの2バイト文字を含む文字から安全に \ を取り除きたい場合は
$strings =~ s/([\x81-\x9f\xe0-\xfc][\x40-\xfc])|\x5c(\x5c)?/$1$2/g;
\\ と二つ並んだものは \ ひとつに。それ以外の単独の \ は全部除去されます。
どのように \ でエスケープされてるかを正しく把握しないと余分な処理しそうなのでご注意
417
(1): 動け動けウゴウゴ2ちゃんねる 2007/02/19(月) 11:12:32 ID:CkwXuHW70(1)調 AAS
read.cgiの関連キーワード、MacのSafariでみるとiframeがスクロールバーで埋まって
なんにも見えないんですがどうにかなりませんかね^^;。。
画像リンク

418: 動け動けウゴウゴ2ちゃんねる 2007/02/19(月) 13:01:54 ID:pBEvSMZ10(1)調 AAS
どこでもトンファー
419: 株価【1200】◆cZfSunOs.U 2007/02/19(月) 16:59:40 ID:Pug69+aE0(1)調 AAS
>>417 read.js なら iframe 使わないからそういう問題は起きないです
......と言おうと思ったら,そもそも Safari だと read.js 自体ちゃんと動かないんですね.
う〜む......
420
(2): おふぃす 2007/02/20(火) 01:03:00 ID:EBLhrkLWP(1)調 AAS
スレ読まずに
誰かの案は採用されたのかい?まだアイディア出しの段階?
421: 動け動けウゴウゴ2ちゃんねる 2007/02/20(火) 10:46:59 ID:vxB49Y9b0(1)調 AAS
Safari での read.cgi の表示直ってました。対応ありがとうございます。m(_ _)m
422
(1): ひろゆき@どうやら管理人 ★ 2007/02/21(水) 23:37:01 ID:???0 BE AAS
誰かの案?
423: 動け動けウゴウゴ2ちゃんねる 2007/02/22(木) 00:11:20 ID:qlrx2fQN0(1)調 AAS
>>422
何が?
424: 動け動けウゴウゴ2ちゃんねる 2007/02/22(木) 00:19:08 ID:wmcK2NTs0(1)調 AAS
>>420でしょ
425: ひろゆき@どうやら管理人 ★ 2007/02/22(木) 00:37:16 ID:???0 BE AAS
あいあい。>>420です。
426: 動け動けウゴウゴ2ちゃんねる 2007/02/22(木) 01:30:14 ID:CIG1Pa+z0(1)調 AAS
このスレの

キーワード【 rw InnoDB urls id words cgi ch 】
427: 動け動けウゴウゴ2ちゃんねる 2007/02/25(日) 01:39:09 ID:ha5BeV2q0(1)調 AAS
スレ内もだけどスレタイから抽出したのがないと
次スレ追っかける時面倒な場合がある
(キーワードが本文であまり使われてない場合とか)
428: おふぃす 2007/02/25(日) 06:13:46 ID:+aZFC3xFP(1)調 AAS
ごめんごめん。
雑談2007に書いたつもりが誤爆ったのさ♪
429
(1): 株価【961】 △△ ◆cZfSunOs.U 2007/02/25(日) 13:06:47 ID:7wLnfKZR0(1)調 AAS
スレタイもキーワード抽出対象にはなってますが,重要度計算で上位に来ないと
入らないこともありうる,と(スレタイは本文の2倍のウェイトで計算してはいますが).
430
(1): 動け動けウゴウゴ2ちゃんねる 2007/02/26(月) 00:33:04 ID:cBYEeqLc0(1)調 AAS
>>388
tv11鯖ではまだ、ページヘッダのリンクに触れない気がします w/Opera9
快適になって安心していたのですが、まだ全鯖対応ではありませんでしたか?
431
(1): 株価【1100】 △△ ◆cZfSunOs.U 2007/02/26(月) 06:31:21 ID:BnRSSGp20(1)調 AAS
>>430 tv11 は banana3102 つまり T-bananaですね.
今は T-banana とそれ以外で read.cgi のソースが統一されておらず,
その作業と併せて行った方が効率的なので,それまでしばらくお待ち下さい.
432: 動け動けウゴウゴ2ちゃんねる 2007/02/26(月) 23:50:24 ID:0DZUXpKj0(1)調 AAS
理解しました。確かにサーバのタイプで乗ってるもの違いますしね。ありがとうございます。
433: 動け動けウゴウゴ2ちゃんねる 2007/02/27(火) 01:20:23 ID:GeMrAsRv0(1/2)調 AAS
>>429
別枠化するか
本文が400kbでスレタイが40bなら10000倍換算ぐらいがいいと思う
434: 動け動けウゴウゴ2ちゃんねる 2007/02/27(火) 01:22:26 ID:GeMrAsRv0(2/2)調 AAS
てかスレタイを単語ごとに区切って直接クリックで飛べるようにとかは?
435: 株価【1200】 △△ ◆cZfSunOs.U 2007/02/27(火) 08:24:10 ID:pqZRuyro0(1)調 AAS
スレタイを重視しすぎると,関連キーワードの性質が微妙に変化しそうな気も.う〜む......
436: 動け動けウゴウゴ2ちゃんねる 2007/02/27(火) 14:17:31 ID:hig0wXqC0(1)調 AAS
そもそも本質は「そのスレの内容から抽出したキーワード」であるので、
ずれた要望はあんまり気にしない方が良いかと。

第一、次スレ検索を主目的にしようとしてる時点で趣旨が違う。
同じ話題が話されているのが次スレだけとは限らないし、
雑談スレなんかスレ毎にキーワードが違うのが当たり前。

関連キーワード検索は「そのスレの内容と同じ話題のスレを検索」
するのであって、「次スレを検索」は用途としてはあっていない。
(結果的に代用出来る場合もあるだけ)
437: 動け動けウゴウゴ2ちゃんねる 2007/02/28(水) 01:50:16 ID:u1t4BgBC0(1)調 AAS
でも関連スレって別板に同じスレタイでたってることが多いし
438: 動け動けウゴウゴ2ちゃんねる 2007/03/03(土) 08:38:56 ID:tOQK59wa0(1)調 AAS
ここにサンプルで貼ったスレ結構クリックされてるなw
439
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/03(土) 11:56:46 ID:oee6jhnS0(1)調 AAS
半角仮名を関連キーワードに反映させることは出来ませんか?
440
(1): 株価【1150】 △△ ◆cZfSunOs.U 2007/03/03(土) 12:52:59 ID:m4T4tan/0(1/2)調 AAS
>>439 単語の抽出に利用している MeCab は,半角カナを記号として扱ってしまうようですね.
キーワードとして利用するのは名詞だけなので......

メールボックスパンクするまで爆撃合戦するスレ
メールボックスパンク    記号,一般,*,*,*,*,*
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
まで    助詞,副助詞,*,*,*,*,まで,マデ,マデ
爆撃    名詞,サ変接続,*,*,*,*,爆撃,バクゲキ,バクゲキ
合戦    名詞,サ変接続,*,*,*,*,合戦,カッセン,カッセン
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
スレ    名詞,固有名詞,組織,*,*,*,*
EOS

メールボックスパンクするまで爆撃合戦するスレ
メールボックス  名詞,一般,*,*,*,*,メールボックス,メールボックス,メールボックス
パンク  名詞,サ変接続,*,*,*,*,パンク,パンク,パンク
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
まで    助詞,副助詞,*,*,*,*,まで,マデ,マデ
爆撃    名詞,サ変接続,*,*,*,*,爆撃,バクゲキ,バクゲキ
合戦    名詞,サ変接続,*,*,*,*,合戦,カッセン,カッセン
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
スレ    名詞,固有名詞,組織,*,*,*,*
EOS
441: 動け動けウゴウゴ2ちゃんねる 2007/03/03(土) 14:43:03 ID:wHf2rjr80(1)調 AAS
ゆゆきし問題ですね
442
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/03(土) 17:19:16 ID:yF+lRADQ0(1/2)調 AAS
>>440
このあたりの Perl コード欲しいですか? jcode.pl だけでなんとかなるなら不要かもだけど
443: 動け動けウゴウゴ2ちゃんねる 2007/03/03(土) 17:28:59 ID:yF+lRADQ0(2/2)調 AAS
C言語でこのあたりのライブラリってどっかにあるのかな……
444: 株価【1050】 △△ ◆cZfSunOs.U 2007/03/03(土) 17:46:33 ID:m4T4tan/0(2/2)調 AAS
>>442 いや,正規化しようと思えばできないことはないんですけど,
パーサは c2.2ch.io の処理で一番重い部分なんで(ほとんどは
MeCab によるものですが),さらに重くするのがいいのかどうか,ってとこで.

# 仮に正規化するなら,1-way の変換ではなく MeCab の処理結果を元に戻す,
# ってとこまでやらなきゃならないですし.
445
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/04(日) 09:51:09 ID:nVnbTany0(1)調 AAS
半角カナを全角カナに変換して処理すればいいんじゃね
446: 株価【1050】 △△ ◆cZfSunOs.U 2007/03/04(日) 19:41:00 ID:98jJiHZT0(1/2)調 AAS
>>445 それが正規化ってことですが......ただ,半角で書かれたものを
全角のキーワードとして表示してもいいのならそれだけでもいいんですが,
半角のは半角のまま表示ということになると,いったん全角に変換したのを
半角に戻す処理も必要になって,そうなると処理が複雑になってくると.
不可能ではないんですが,重くなりそうだなぁ,と......
447: 動け動けウゴウゴ2ちゃんねる 2007/03/04(日) 19:47:14 ID:i3rGGgjT0(1)調 AAS
半角を全角にしてそのままでいいんじゃないかな
448: 動け動けウゴウゴ2ちゃんねる 2007/03/04(日) 20:21:29 ID:Qp8jFuR10(1)調 AAS
2ch検索の方で半角/全角片仮名の同一視が機能しているんなら、全角のままで良いんじゃないかい?
449
(1): 株価【1050】 △△ ◆cZfSunOs.U 2007/03/04(日) 22:23:49 ID:98jJiHZT0(2/2)調 AAS
半角カナで独特のニュアンスを表現する 2ch の文化(?)を考えると
全角に変換したままってのもどうかなぁ......とも思ってたんですが,
とりあえず全角のままでやってみます.
再クロールは2日周期なんで徐々に反映されるかと.
450: 動け動けウゴウゴ2ちゃんねる 2007/03/05(月) 13:05:32 ID:ckCgsY7X0(1)調 AAS
ttsだと逆に全角を半角にして処理してるが
それによる不都合も相当ある
2chスレ:esite
tGrepは完璧
451: 動け動けウゴウゴ2ちゃんねる 2007/03/05(月) 18:26:45 ID:D+u/AYgk0(1)調 AAS
あのさIDはやめにしない?
2chスレ:newsplus
外部リンク[cgi]:p2.2ch.io
452: 動け動けウゴウゴ2ちゃんねる 2007/03/05(月) 19:26:23 ID:qjpPIEp90(1)調 AAS
本文に書かれちゃうとどうしてもねぇ。
453: 動け動けウゴウゴ2ちゃんねる 2007/03/06(火) 02:56:01 ID:1Igmeu5x0(1)調 AAS
"ctaAcx"とか本文に出てきてないし
454: 株価【1100】 △△ ◆cZfSunOs.U 2007/03/06(火) 12:54:47 ID:Nvn/63930(1/2)調 AAS
キーワード収集対象は本文とスレタイだけで,それ以外は対象外ですが......
と思ったら,>>449 の時にミスったようですね,すみません.
これから(再)クロールされる分は正常になるかと.
455
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/06(火) 18:25:54 ID:RZaN2IVv0(1)調 AAS
あれ落ちたスレの奴って吹っ飛ぶんだっけ?
前は生きてたと思ったけど
456
(1): 株価【1100】 △△ ◆cZfSunOs.U 2007/03/06(火) 21:33:48 ID:Nvn/63930(2/2)調 AAS
>>455 データが無限に膨張し続けないように,dat 落ちしたのは消すようになってます.
ただ,再クロールは2日周期なので,落ちてからデータが消えるまでのタイムラグはあると思いますが.
457: 動け動けウゴウゴ2ちゃんねる 2007/03/08(木) 18:59:20 ID:cMnMtVSa0(1/2)調 AAS
それだと次スレ追跡には使いづらいわねえ
458: トラックバック ★ 2007/03/08(木) 21:08:02 ID:cMnMtVSa0(2/2)調 AAS
【トラックバック来たよ】 (ver. 0.11)
[タイトル] スレタイ検索 スレッドタイトル検索サービス♪2find
[発ブログ] ネットサービス@2ch掲示板
2chスレ:esite
[=要約=]

主要なもの
外部リンク:ttsearch.net 外部リンク:www2.ttsearch.net
外部リンク[cgi]:page2.xrea.jp
外部リンク:www6.big.or.jp

公式のサービス
外部リンク:find.2ch.net 外部リンク:test.razil.jp(苦情は向こうで)
外部リンク:h.u.la
外部リンク:is.2ch.net

その他の検索
外部リンク[net]:www.google.co.jp
外部リンク:www.2chs.net
外部リンク:www.mimizun.com
外部リンク:makimo.to

こんな風に使ったり 外部リンク:find.2ch.net

<a href="../test/read.cgi/esite/1173355555/2-30" target="_blank">>>2-30</a>
459
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/11(日) 20:51:40 ID:L60sUdWe0(1)調 AAS
>>456
スレ落ち後は次スレ追跡モードに差し替えるとかは?
460
(1): 株価【1000】 △△ ◆cZfSunOs.U 2007/03/11(日) 21:52:08 ID:DiueM2R90(1)調 AAS
>>459 そのためのデータを保持することになれば,結局データが膨張し続けることになるし,
またデータを保持せず on the fly に生成させるとなると,忙しくなりすぎて破綻しそうだし......
いずれにせよ,過去ログ用に別途専用鯖等のリソースを投入するとかでもない限り困難ではないかと......
461
(2): ひろゆき@どうやら管理人 ★ 2007/03/12(月) 12:41:31 ID:???0 BE AAS
過去ログ用に固定テキストをひたすら保存するサーバがあっても
いいような気がしてきました。
つか、memoriesに同居とか。
462
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/12(月) 12:49:49 ID:Mzo4MlK10(1)調 AAS
>>461
memoriesそろそろ容量が少なくなってきてるらしいですよ・・・。
まあ、増設できるらしいですが・・・。
前にもらったtigerあまってないんですか?

それとbeのメール機能が時々おかしいので見てもらえるとうれしいです・・・。
463
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/12(月) 14:54:54 ID:AFyu+OQm0(1)調 AAS
なんかコストばっか掛かって利が無いような。
datにくっ付けちゃうってのはどうなの?できない?
464
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/12(月) 20:38:10 ID:rmdcm8FM0(1)調 AAS
>>460
「次スレ追跡する」ボタンみたいにワンクッションおくとかは?
見たい人だけ使う
465: 株価【960】 △△ ◆cZfSunOs.U 2007/03/12(月) 20:51:43 ID:8usXw0FZ0(1/4)調 AAS
>>461 なるほど......ただ,memories だと HDD 容量もさることながら
httpd + offlaw.cgi なんかと競合しないかなぁ,とか(MySQL を
ストレスなく動かすには,メモリとかリソース結構食いますし).

>>462 残ってる stiger を専用で使うならリソースの競合とかは心配ないですね.
ただ,そんなに HDD 容量がデカいわけでもないんで...... とはいえ,
単にライブな dat のキーワードをコピーして保存するだけなら,
重要度計算用のデカいテーブル (regwords) は過去ログデータの方では
不要なんで,当面は心配ないかも.中長期的には問題ですが......
もっとも,問題が起きたらその時改めて考えよう,ということにしておけば
2ch らしいかも?w

>>463 dat にそういうデータを付けていいのかどうか,っていう
ポリシーの問題もあるかもですね.あと,dat 落ちを制御してる
F22 はいろいろ亜種ができてるらしいとかで,それぞれの鯖で
個別に F22 を改造しなきゃならないかも,っていうのも......
466: 株価【960】 △△ ◆cZfSunOs.U 2007/03/12(月) 20:56:16 ID:8usXw0FZ0(2/4)調 AAS
>>464 ワンクッション置いても,データ保存するとすれば
結局データ量が増大することに変わりないですし,
on the fly に生成するにしても,今の p2.2ch.io / c2.2ch.io は
リアルタイムにキーワード抽出する前提で作ってないので
苦しいことには変わりないです.
467: 動け動けウゴウゴ2ちゃんねる 2007/03/12(月) 21:03:17 ID:AIFnMu+70(1)調 AAS
難しいかなって思うのもいいけど、がんがん試しちゃうのも吉。
もちろん試すのにいろいろ準備とかあって大変だとは思うけど。
468: 株価【960】 △△ ◆cZfSunOs.U 2007/03/12(月) 21:33:42 ID:8usXw0FZ0(3/4)調 AAS
試すにしても,ライブ dat のキーワード表示に悪影響を与えると元も子もないんで......
なので,過去ログに対処するなら専用鯖等のリソース投入が前提じゃないかなぁと.
469: 株価【960】 △△ ◆cZfSunOs.U 2007/03/12(月) 21:37:20 ID:8usXw0FZ0(4/4)調 AAS
まぁ,専用「鯖」でなくとも,今の c2 に過去ログ用にストレージ追加とかでもいいかもですけど.
470
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/13(火) 20:31:36 ID:rUlVQy5G0(1)調 AAS
スタートレックをスタートとレックで区切るのやめて欲しい
471: 株価【1250】 △△ ◆cZfSunOs.U 2007/03/13(火) 22:58:42 ID:aGhE8Edp0(1)調 AAS
まぁ,意図してる訳じゃないけど MeCab がそう区切ってるってことで......>>470
472
(2): ひろゆき@どうやら管理人 ★ 2007/03/14(水) 19:54:38 ID:???0 BE AAS
過去ログに関しては、関連キーワードが変更されることがないので、
スレッドkeyのテキストファイルを作って置いておくだけでいいと思うのです。
ってことで、mysqlはいらないかと。
473: 動け動けウゴウゴ2ちゃんねる 2007/03/14(水) 20:08:28 ID:LYxNhfWe0(1)調 AAS
しんぷるいずべすと、と。

ところで

>>472
なんかネタ落としてってw

ひろゆきを訴えたGJ会社員(35) 今度は毎日新聞を訴えてひろゆき涙目www
2chスレ:news
474: 株価【1095】 △△ ◆cZfSunOs.U 2007/03/14(水) 20:48:05 ID:e0bdMMl00(1)調 AAS
>>472 なるほど......となると,あとは memories 等に
どういう形で入れればいいか,またそれをどうやって read.cgi で
表示させるか,ってあたりですか.ぼちぼち考えてみます.
475
(1): ひろゆき@どうやら管理人 ★ 2007/03/14(水) 21:55:27 ID:???0 BE AAS
XMLにしてjavascriptでincludeみたいなのって出来ないんでしたっけ?
476: 株価【1000】 △△ ◆cZfSunOs.U 2007/03/15(木) 05:01:15 ID:VWGYvz9I0(1)調 AAS
>>475 XMLHttpRequest だと同一ドメイン(というか実質同一鯖)の制限がありますが,
JSON ならその制限なしで可能です.というか,read.html 用 I/F では今も JSON 的な
やり方でやってます.ただ,read.cgi だとブラウザ側の JavaScript の処理能力の不安があって......
477
(2): root▲▲ ★ 2007/03/15(木) 13:05:40 ID:???0 BE AAS
1台、それ用のサーバを用意するかんじですかね。

memoriesのHDDに常時書き込み負荷をかけるのは、
できれば避けたいかも。
478: 動け動けウゴウゴ2ちゃんねる 2007/03/15(木) 20:08:32 ID:/5nJizMU0(1)調 AAS
findたまに重いとか話出るけど冗長化しなくて大丈夫なの
ふらだんすに振るとか
479
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/15(木) 22:40:12 ID:BMqIkGm60(1)調 BE AAS
UNIX板のスレをOperaで見ると、今も >>184 の現象
| Operaだと関連キーワードやofuda.ccのあれととスレの一番上の全部や掲示板に戻るが重なって
| 掲示板に戻るがクリックできない。
なのですが、>>375-388 のは pc11 鯖には入ってないんでしょうか?
480
(2): ひろゆき@どうやら管理人 ★ 2007/03/15(木) 22:58:59 ID:???0 BE AAS
HDDの速度がはやいハードウェアをどこかから調達するといい感じなんですかね。
T-Bananaサーバーの実験を手伝うって名目でなんとかしてもらうとか、、
481: 動け動けウゴウゴ2ちゃんねる 2007/03/15(木) 23:01:17 ID:MBGNf4P70(1)調 AAS
名目て
482: ひろゆき@どうやら管理人 ★ 2007/03/15(木) 23:04:15 ID:???0 BE AAS
大義名分ってやつですよ。えぇえぇ。
483: フェンリル ◆Fenrir/gaQ 2007/03/15(木) 23:06:54 ID:Sg/SBOFd0(1)調 BE AAS
自己板の規制解除しなさい
484
(1): 株価【1000】 △△ ◆cZfSunOs.U 2007/03/16(金) 06:49:26 ID:2y/u3Gvi0(1/2)調 AAS
>>479 pc11 = T-banana なので >>431 ということで......

# そろそろ 2chスレ:operate
# やってもいい頃じゃないか,って気もしないではないですが......

>>480 さっそく 2chスレ:operate がw
ただ,過去ログ用の HDD でほしいのは速度より容量なんですよね.
# むむむさんの >>477 の真意は,「HDD にダメージを与えず長持ちさせたい」ってことじゃないかと.

T-banana のようにディスク I/O の性能が高く,かつ RAM もたくさん積んであるマシンなら,
むしろ MySQL でデカいデータをがんがん扱う用途の方が向いてそうな気がしますね,個人的には.
485: root▲▲ ★ 2007/03/16(金) 10:15:40 ID:???0 BE AAS
>>484
> # むむむさんの >>477 の真意は,「HDD にダメージを与えず長持ちさせたい」ってことじゃないかと.

ですね。
memoriesはデータ格納時以外はほぼread onlyで使いたいなと。
486: root▲▲ ★ 2007/03/16(金) 10:17:32 ID:???0 BE AAS
>>480
HDDの容量が20G台でいいなら、
今使っていないstigerを1台、それ用に割り当ててみるとかですが、
もっと必要なかんじですかね。
487: ひろゆき@どうやら管理人 ★ 2007/03/16(金) 12:59:57 ID:???0 BE AAS
必要なHDD容量の算定からはじめてみますか。
488: 株価【950】 △△ ◆cZfSunOs.U 2007/03/16(金) 19:36:54 ID:2y/u3Gvi0(2/2)調 AAS
「各スレ単位で必要な容量 x 過去ログ発生速度」で,どれだけの期間持つか,てな感じですか.

データを .js のように直接表示できる形で保存するとサイズは大きくなるが CPU の仕事は少ない,
一方 CSV のような形で保存するとサイズは小さくなるが表示する際の CPU の仕事が増える,と.
まぁ CPU の仕事が増えるといっても,現状 p2.2ch.io 1台で全ライブスレの
getf.cgi 表示させてるぐらいなので,stiger を専用で割り当てるなら問題ないと思いますが.

ただ,各スレ単位でファイル作ると,HDD 消費はバイト単位でなくフラグメントサイズ単位になるんですよね.
HDD スペースの利用効率を向上させるには,1ファイルに複数のスレのデータを書き込んだ方がいいのか.
その代わり,必要なデータを検索する仕事が増えると.1ファイルに書き込みつつ
検索も効率的にするには......結局 MySQL を使うとかなるのかな.
489
(1): ひろゆき@どうやら管理人 ★ 2007/03/16(金) 22:31:20 ID:???0 BE AAS
freebsdのフラグメントサイズってどれくらいなんですか?
490: 動け動けウゴウゴ2ちゃんねる 2007/03/16(金) 22:52:28 ID:9GMYZRZqP(1)調 BE AAS
ひーさん2証なんとか汁><。
491: root▲▲ ★ 2007/03/16(金) 22:58:22 ID:???0 BE AAS
>>489
デフォルトでは16k(16384)ですね。

man newfs
...
-b block-size
The block size of the file system, in bytes. It must be a power
of 2. The default size is 16384 bytes, and the smallest allow-
able size is 4096 bytes. The optimal block:fragment ratio is
8:1. Other ratios are possible, but are not recommended, and may
produce poor results.

4k まで小さくできますが、あんまりおすすめしないかも。
492
(1): ◆Choco52.ko 2007/03/16(金) 23:27:05 ID:qjJyqUxr0(1)調 AAS
専門な話題なので横槍!
フラグメントサイズはブロックサイズを8分の1したものがデフォルトで使われるので 2k(2048)バイト ではないかと。
newfs -b 16384 -f 2048 のように指定されているはずか、オプションなしのどちらかですね。

man newfs

-f frag-size
ファイルシステムのフラグメントサイズをバイト単位で指定します。
blocksize/8 から blocksize までの範囲の、2 のべき乗である必要があります。
デフォルトは 2048 バイトです。
493: root▲▲ ★ 2007/03/16(金) 23:48:12 ID:???0 BE AAS
>>492
確かに、フラグメントサイズとブロックサイズは別物ですね。
ご指摘&補足すみませんです。
494: ひろゆき@どうやら管理人 ★ 2007/03/17(土) 12:36:35 ID:???0 BE AAS
過去ログのファイル数ってどれくらいなんすかね。。
495: 株価【960】 △△ ◆cZfSunOs.U 2007/03/17(土) 19:55:25 ID:2JLdzq820(1)調 AAS
各板のライブスレ数は大きく変動しないという前提なら,
過去ログ発生速度≒新スレが立つ速度
なのかなぁ......
496: 動け動けウゴウゴ2ちゃんねる 2007/03/17(土) 22:31:56 ID:QoCeQg460(1)調 AAS
これどういうシステムなの?
どうやったら反映されるの?
497
(1): 動け動けウゴウゴ2ちゃんねる 2007/03/19(月) 11:31:06 ID:DEGsDWtn0(1)調 AAS
スレ内の全レスから単語抽出、DB化して、一定の条件で最頻と思われる
単語を表示させる。
498
(1): 動け動けウゴウゴ2ちゃんねる 2007/04/01(日) 17:25:54 ID:azmkmmMB0(1/2)調 AAS
>133
多分92のキーワードというのがスレの関連した語句になるので、それの検索は考えています。
自動的に"「74」「SevenFour」"など関連した語句の摘出は、ネタとしては面白いのですが、
難易度が高いというか、スレ名によっては多分バカ検索になるので、やるとしても実験的な機能としての
実装になります。多分正解は134さんが書かれているスレッド検索に正規表現をサポートでしょう。

>135
いろいろ作っていますが、どれも中途半端でして、、、

>136-139
先にも書きましたが、弱いとか、上手くいかないのではなく、元々対応していないというのが正解のようです。
今回版で一応修正しましたので、御報告いただければ助かります。

>141
>●対応って、面倒なの?
有償アカウントが必要なんですよね? いまのところ対応予定無しです。
>それと、まちBBSとかが見れないんだけど
過去ログを見ると2chに完全対応したら対応させる等書かれていましたので、メニューのトップには
表示されていますが、対応していません。対応させたいのですが、他が優先順位が高いので調査等保留状態です。

>142
すみません。ちょっと意味が判りません。

>143
まだ考え中ですが、本体側ではスレへアクセスの時に毎回キーワード取得してデータベースに溜めていきます。
あとキーワードを入力するIFを用意してユーザーからも入力が可能とします。
js側のAPIはデータベースへアクセスするsfSystem.getKeywordsとsfSystem.setKeywordを用意します。
溜められたデーターは検索やスマートボードに使ったり出来ます。
データベース内の削除は必要かなぁ。と 時間がなかなか取れないので、そんな感じで止っています。
499: 498 2007/04/01(日) 17:29:44 ID:azmkmmMB0(2/2)調 AAS
あう、誤爆すまん。
500: 動け動けウゴウゴ2ちゃんねる 2007/04/01(日) 21:24:12 ID:E7umBdRz0(1)調 AAS
何で本スレに限って出ないんだろうな
外部リンク:find.2ch.net

2chスレ:curry
501: 動け動けウゴウゴ2ちゃんねる 2007/04/06(金) 19:29:06 ID:vyYNJZL70(1)調 AAS
同じキーで何回も検索するとヒット数がまちまちになるぞ
ヒットしたりしなかったりするスレがある模様
502: nanasi [afadsaa] 2007/04/07(土) 17:34:36 ID:fHLFxxU/0(1)調 AAS
>>60

503
(1): 動け動けウゴウゴ2ちゃんねる 2007/04/25(水) 18:23:22 ID:0Clz8p7L0(1)調 AAS
>>497
スレ内に一度も出てない単語はキーワードとして表示されないの?
504: 株価【900】 △△ ◆cZfSunOs.U 2007/04/26(木) 08:35:10 ID:Hogck5gy0(1)調 AAS
>>503 そういうことになってます.
505: 動け動けウゴウゴ2ちゃんねる 2007/04/27(金) 18:31:25 ID:3Jd+uTfZ0(1)調 AAS
これもひでえなあ
ろう じろう しま があってしまじろうがないw
外部リンク[cgi]:p2.2ch.io
506: 動け動けウゴウゴ2ちゃんねる 2007/04/28(土) 23:33:49 ID:atmqjoj00(1)調 AAS
ひらがなとカタカナの2字ははじこうぜ
507: 動け動けウゴウゴ2ちゃんねる 2007/04/30(月) 01:25:58 ID:2vpscozg0(1)調 AAS
アイコンスレでアイコって酷くね
外部リンク[cgi]:p2.2ch.io
無論無関係なスレばかりヒット&元のスレもヒットせず

リザルトがないのとかあってもまるで関連性のないやつは除外できないんかね
508: 株価【780】 △△ ◆cZfSunOs.U 2007/04/30(月) 17:33:19 ID:aNOXlsrQ0(1)調 AAS
前後の状況によって「アイコン」の区切りはまちまちになるみたいですねぇ<MeCab

【Be】アイコン売買促進スレ★7【icon】
【 記号,括弧開,*,*,*,*,【,【,【
Be 名詞,固有名詞,組織,*,*,*,*
】 記号,括弧閉,*,*,*,*,】,】,】
アイコン 名詞,固有名詞,一般,*,*,*,*
売買 名詞,サ変接続,*,*,*,*,売買,バイバイ,バイバイ
促進 名詞,サ変接続,*,*,*,*,促進,ソクシン,ソクシン
スレ 名詞,一般,*,*,*,*,*
★ 記号,一般,*,*,*,*,★,★,★
7 名詞,数,*,*,*,*,*
【 記号,括弧開,*,*,*,*,【,【,【
icon 名詞,固有名詞,組織,*,*,*,*
】 記号,括弧閉,*,*,*,*,】,】,】
EOS

2ちゃんねる beアイコン サイト
2 名詞,数,*,*,*,*,2,ニ,ニ
ちゃん 名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
ねる 動詞,自立,*,*,一段,基本形,ねる,ネル,ネル
be 名詞,固有名詞,組織,*,*,*,*
アイコン 名詞,一般,*,*,*,*,*
サイト 名詞,一般,*,*,*,*,サイト,サイト,サイト
EOS

アイコン全リスト、販売者登録所、価格情報ほか
アイコ 名詞,固有名詞,一般,*,*,*,アイコ,アイコ,アイコ
ン 名詞,非自立,一般,*,*,*,ン,ン,ン
全 接頭詞,名詞接続,*,*,*,*,全,ゼン,ゼン
リスト 名詞,一般,*,*,*,*,リスト,リスト,リスト
、 記号,読点,*,*,*,*,、,、,、
販売 名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ
者 名詞,接尾,一般,*,*,*,者,シャ,シャ
登録 名詞,サ変接続,*,*,*,*,登録,トウロク,トーロク
所 名詞,接尾,一般,*,*,*,所,ショ,ショ
、 記号,読点,*,*,*,*,、,、,、
価格 名詞,一般,*,*,*,*,価格,カカク,カカク
情報 名詞,一般,*,*,*,*,情報,ジョウホウ,ジョーホー
ほか 名詞,副詞可能,*,*,*,*,ほか,ホカ,ホカ
EOS

アイコンショッパー
アイコンショッパー 名詞,固有名詞,組織,*,*,*,*
EOS

他板のアイコンスレ(2ちゃんねる検索)
他 接頭詞,名詞接続,*,*,*,*,他,タ,タ
板 名詞,一般,*,*,*,*,板,イタ,イタ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
アイコンスレ 名詞,一般,*,*,*,*,*
( 記号,括弧開,*,*,*,*,(,(,(
2 名詞,数,*,*,*,*,2,ニ,ニ
ちゃん 名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
ねる 動詞,自立,*,*,一段,基本形,ねる,ネル,ネル
検索 名詞,サ変接続,*,*,*,*,検索,ケンサク,ケンサク
) 記号,括弧閉,*,*,*,*,),),)
EOS
509: 動け動けウゴウゴ2ちゃんねる 2007/05/03(木) 16:13:12 ID:X+h1qUif0(1)調 AAS
カタカナやひらがなで直後にンが来る語句は
ンの直前で区切っちゃいけないんじゃないの
510: 動け動けウゴウゴ2ちゃんねる 2007/05/13(日) 23:52:21 ID:MYLVfRHs0(1)調 AAS
あと拗音とか促音の直前で区切るのも
2chスレ:anime3
511: 株価【900】 △△ ◆cZfSunOs.U 2007/05/14(月) 00:28:23 ID:m8V1KKDb0(1)調 AAS
まぁ,単語の区切りは 外部リンク:mecab.sourceforge.net に依存してますからねぇ......
512: p3084-ip01kyoto.kyoto.ocn.ne.jp [man] 2007/05/15(火) 16:20:44 ID:lac4/GYb0(1)調 AAS
syosinsya
513: 動け動けウゴウゴ2ちゃんねる 2007/05/16(水) 02:45:21 ID:hDvpyprTO携(1)調 AAS
とまと
514: 動け動けウゴウゴ2ちゃんねる 2007/07/03(火) 00:54:54 ID:jUIBhvnj0(1)調 AAS
また拗音で始まるのが
外部リンク[cgi]:p2.2ch.io
2chスレ:dog
515: 動け動けウゴウゴ2ちゃんねる 2007/07/11(水) 19:21:02 ID:YcnBJDt20(1)調 AAS
メンテ予告とかメンテ中の表示とかすこしは工夫すればいいのに
516: ◆0Two/OnDrg 2007/07/19(木) 06:18:32 ID:oNNrBCU9O携(1)調 AAS
だね
517: ' 2007/07/26(木) 13:46:00 ID:SSKwDJ+BO携(1)調 AAS
ぴろゆきどこにいるんですか??
518: 動け動けウゴウゴ2ちゃんねる 2007/09/18(火) 01:02:17 ID:iAwGFgtR0(1)調 AAS
あのさクリックされたのとか実際に検索で使われてるやつの優先度あげない?
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.216s*