[過去ログ] 正規表現道場@2ch Part3 s/煽り|荒らし/あぼーん/g (989レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
412(1): 04/05/03 23:52 ID:??? AAS
HTMLパーサ?モジュール使ったらあかんの?Perlでしょ?
413: 393 04/05/04 00:09 ID:??? AAS
>>412
HTML::Parseモジュールの使い方を理解するのが面倒くさかった
&
掲示板の投稿に特定のタグと属性のみ許可する、文法に従わないタグは
その旨マークしてテキストとして表示する、という限定的用途なので、自作
のほうが汎用モジュールより高速だと思った
&
Perlと正規表現の勉強のため
て、感じで。
414: 04/05/04 01:54 ID:??? AAS
ま、車輪の再発明は勉強には有用だが、
実用には不向きなので。
415: [age] 04/05/05 18:30 ID:??? AAS
荒らし板は通報せよ!荒らし狩りだっ!
名無しさん@ゴーゴーゴーゴー! :04/04/14 17:58 ID:WE3vDaf0
愛と荒らしの掲示板:外部リンク:bbs2.otd.co.jp
が痛い。荒らし依頼すっと、IPアドレス晒される
依頼か (?)要注意。あまりの痛さにPCを殴りたくなった。
今度は「愛と臨時の掲示板」だってさ!痛すぎる馬鹿だな!
外部リンク:bbs10.otd.co.jp
逃げても無駄だぜ!ゲロ!!つーかお前馬鹿?
卑怯者!逃げるなよ、潜伏中か?
愛と荒らしの掲示板(逃亡先):外部リンク:bbs10.otd.co.jp
416: 未承諾広告※ ◆TWARamEjuA 04/05/05 18:55 ID:??? AAS
Rock54 対象の悪寒。
417: [age] 04/05/06 22:18 ID:??? AAS
/^0?[0-3]?[0-7]{1,2}$/ってどんな意味ですか?
418: 04/05/06 23:08 ID:??? AAS
そのまんまだと思うのだが。
419: 04/05/07 00:17 ID:??? AAS
0377までの8進数
420(8): 04/05/09 00:57 ID:R8gJ7rV0(1) AAS
perlをシフトJISで書いてるんですが、「表」とかの文字化けする文字を正規表現でマッチングさせる
にはどうしたらいいでしょうか。
$_ =~ s/表/表\/g;
みたいなことをしたいんですが上記の場合「表」のコードが(95 5C)なのでエラーに
なってしまいます。コードのまま検索かけてもうまくいきませんでしたし
$_ =~ s/95 5C/95 5C 5C/g;
どうすれば「表」という一文字を検索に引っ掛ける事ができるでしょうか?
421: 420 04/05/09 01:29 ID:??? AAS
色々試していたら、デコードした後に下記のやり方で一応できたのですが、
$_ =~ s/\x95/表\/g;
でも\x95だけでは他の文字にも影響が出てしまいますよね。それで
$_ =~ s/\x95\x5C/g;
としてみましたがこれではマッチしてくれませんでした。どうすればいいでしょうか。
422(1): 04/05/09 01:45 ID:??? AAS
要は文字化けしないようにエスケープしたいんじゃろ?
出力だけでなく処理もSJISでやってるなら展開しないように工夫すれ
423: 04/05/09 02:02 ID:??? AAS
つか、内部処理はEUCでやれよと
424(2): 420 04/05/09 02:08 ID:??? AAS
>>422
はい。フォームに入力してもらった文字列をオウム返しに次のページに出力したり
内容をsendmailで送ったりの時に文字化けが起こらないようにしたいんです。
ところで、みんなはクエリは受け取ったらeucに変換して処理をした後、出力時にsjis
に変換しているのですか?
プラットフォームがwinならsjisで、unixならeucに変換して扱うみたいな事を聞いたの
ですが、winでも処理時はeucで出力の時にsjisに変換すれば大丈夫なんでしょうか?
425(2): 04/05/09 02:16 ID:??? AAS
>>420
外部リンク[htm]:homepage1.nifty.com
426(1): 04/05/09 02:18 ID:??? AAS
>>424
HTMLをEUCで書く
PerlCGIをEUCで書く
「表」とかで悩んだことは一度も無し。
ほんとみんな無駄な苦労してるなあと思ってる。
HTMLがShift_JIS指定されてたら、最初にEUCに変換してから処理してる。
(変換時にはちゃんとincode=sjisを付ける)
427(1): 420 04/05/09 02:39 ID:??? AAS
みなさんありがとうございます。今までずっとメモ帳でやってたので、perlもhtml
も自動的にShift_JISで書いてました。何かエディタを使おうと思いますが、色付けもなく
特定文字が太字にもならない、メモ帳と違うのは漢字コード指定で再読み込みができる
っていう感じのはないんですかね。一応terapadは持ってるんですが、色はよくても
太字になるし、たまに挿入モードから勝手に上書きモードになっちゃうしで、使いづらいんですよね。
>>426
>HTMLがShift_JIS指定されてたら、最初にEUCに変換してから処理してる。
ここらへんが不安だったのでeucで書くのをためらってるのですが、htmlやperlを書くときに
エディタを使ってeucで書くと、ブラウザ側がシフトJISの時に文字化けしますよね?
〜最初にeucに変換してから処理する〜の意味が理解できなくて・・・
省3
428: 04/05/09 03:08 ID:??? AAS
>>424
> はい。フォームに入力してもらった文字列をオウム返しに次のページに出力したり
> 内容をsendmailで送ったりの時に文字化けが起こらないようにしたいんです。
そこでなんで $_ =~ s/表/表\/g; みたいな処理が必要なの?
429(1): 420 04/05/09 03:48 ID:??? AAS
Sift_JISでやっているので、「表」という文字は文字化けしてしまうので、相手が入力した文字の
中に表が入っているか検索して、入っていたら表の後ろに\をつけて問題を解決しようと
思ってましたが、sjisでやること自体が間違いみたいですね。
ところでこれはスレ違いな質問なんですが、エディタを使う事にしたのでファイルの関連付けをメモ帳の部分を
全て変えたのですが、HTMLページのソースを開くときに何故かメモ帳が起動してしまうのですが
どうしてでしょうか。
430(1): 420 04/05/09 04:05 ID:??? AAS
>HTMLがShift_JIS指定されてたら、最初にEUCに変換してから処理してる。
>(変換時にはちゃんとincode=sjisを付ける)
perlをeucで書く場合(HTMLがShift_JIS指定されてる場合),
print "文字列";
を
$data="文字列";
jcode::convert(\$data,"sjis");
print $data;
としなくてはならないのですか?ってこれも凄いスレ違いですね。こうゆう事はどこのスレに行って
質問すればよいでしょうか。
431: 04/05/09 04:30 ID:??? AAS
>>420
おまいは何もかもすべて他人任せなのか?
ちったぁ自分の脳を使え!
上下前次1-新書関写板覧索設栞歴
あと 558 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.020s