[過去ログ]
正規表現道場@2ch Part3 s/煽り|荒らし/あぼーん/g (989レス)
正規表現道場@2ch Part3 s/煽り|荒らし/あぼーん/g http://tamae.5ch.net/test/read.cgi/php/1069245758/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
403: nobodyさん [sage] 04/04/29 20:44 ID:??? 環境 WindowsXP SP1 ActivePerl 5.8.0.806 正規表現でカタカナの「ゼ」を使うとエラーになってしまいます。 カタカナのゼを含む場合だけ「Unmatched [ in regex;」というエラーで止まってしまい、ほかの文字は大丈夫そうなのですが、対処法ありませんか? if($temp =~ /ゼ/){ 色々; } http://tamae.5ch.net/test/read.cgi/php/1069245758/403
404: nobodyさん [sage] 04/04/29 20:51 ID:??? >>389 そんなバカなと思いつつ確認完了。 なぜだろう。 >>393 できるかも知れないけど、プログラム書いたほうが楽だと思う。 >>396 http://www.w3.org/TR/html401/charset.html#h-5.3.2 http://tamae.5ch.net/test/read.cgi/php/1069245758/404
405: nobodyさん [sage] 04/04/29 20:59 ID:??? >>403 ttp://homepage1.nifty.com/nomenclator/perl/shiftjis.htm if($temp =~ /\Qゼ\E/){ http://tamae.5ch.net/test/read.cgi/php/1069245758/405
406: nobodyさん [sage] 04/04/29 21:11 ID:??? >>405 ありがとうございます。 とりあえず意図した動作をするようになりました。 文字コードのせいで [ に認識されていたんですね。 紹介していただいたURLもブックマークしました。 熟読しますね。 http://tamae.5ch.net/test/read.cgi/php/1069245758/406
407: nobodyさん [sage] 04/04/29 23:02 ID:??? >>393 my $attr = qr/\w+=(?:(?:(')|(")|([^>]))(?:(?(2)[^']*)(?(3)[^"]*)(?(4)[^\s>]*))(?:(?(2)')(?(3)"))\s*)?/; my $amp = qr/&(?!(?:(?:\#\d+)|(?:\#x[a-f\d]+)|(?:\w+));)/i; s/(<\/?\w+\s*(?:$attr)*>)|(<)|(>)|(")|($amp)/ $1 and $1 or $5 and '<' or $6 and '>' or $7 and '"' or $8 and '&' /xge; Perlで書いてみたけど、どこか穴があるかも。 http://tamae.5ch.net/test/read.cgi/php/1069245758/407
408: nobodyさん [sage] 04/04/29 23:05 ID:??? > $1 and $1 or $5 and '<' or $6 and '>' or $7 and '"' or $8 and '&' $1 and $1 or $5 and '<' or $6 and '>' or $7 and '"' or $8 and '&' http://tamae.5ch.net/test/read.cgi/php/1069245758/408
409: nobodyさん [sage] 04/04/30 06:46 ID:??? >>404 > http://www.w3.org/TR/html401/charset.html#h-5.3.2 なるほど。では、タグ外で"とかまで変換しても害は無いですね。 http://tamae.5ch.net/test/read.cgi/php/1069245758/409
410: 393 [sage] 04/05/03 22:32 ID:??? >>407ありがと。 しかし内容を理解しようとしてみたが、いまだわかりません。 簡単なhtmlパーサを作っていて、<br>と<img>はインライン要素で、閉じタグもない から、他の処理がすべて終わった後に置き換えればいいや、というロジックでした。 よく考えたら、文字列中に実体参照で<>が出てきたとしても、&が&に展開 されるので、いちど実体参照に展開してから、すべての処理が終わった後に、 s/<br>/<br>/i s/<img src="([^"<>]*)">/<img src="$1">/i これでいけました。 いろいろテストしていたので、反応が遅くてすまんです。 http://tamae.5ch.net/test/read.cgi/php/1069245758/410
411: 393 [sage] 04/05/03 22:39 ID:??? あ、gオプション書き忘れ。s///giね。 それと、お世話になりましたので、ヘタレの作ったhtmlパーサでも見てやろうかという 方がいるならアプロダにでもソースさらします。 http://tamae.5ch.net/test/read.cgi/php/1069245758/411
412: nobodyさん [sage] 04/05/03 23:52 ID:??? HTMLパーサ?モジュール使ったらあかんの?Perlでしょ? http://tamae.5ch.net/test/read.cgi/php/1069245758/412
413: 393 [sage] 04/05/04 00:09 ID:??? >>412 HTML::Parseモジュールの使い方を理解するのが面倒くさかった & 掲示板の投稿に特定のタグと属性のみ許可する、文法に従わないタグは その旨マークしてテキストとして表示する、という限定的用途なので、自作 のほうが汎用モジュールより高速だと思った & Perlと正規表現の勉強のため て、感じで。 http://tamae.5ch.net/test/read.cgi/php/1069245758/413
414: nobodyさん [sage] 04/05/04 01:54 ID:??? ま、車輪の再発明は勉強には有用だが、 実用には不向きなので。 http://tamae.5ch.net/test/read.cgi/php/1069245758/414
415: nobodyさん [age] 04/05/05 18:30 ID:??? 荒らし板は通報せよ!荒らし狩りだっ! 名無しさん@ゴーゴーゴーゴー! :04/04/14 17:58 ID:WE3vDaf0 愛と荒らしの掲示板:http://bbs2.otd.co.jp/16588/bbs_plain が痛い。荒らし依頼すっと、IPアドレス晒される 依頼か (?)要注意。あまりの痛さにPCを殴りたくなった。 今度は「愛と臨時の掲示板」だってさ!痛すぎる馬鹿だな! http://bbs10.otd.co.jp/286214/bbs_plain 逃げても無駄だぜ!ゲロ!!つーかお前馬鹿? 卑怯者!逃げるなよ、潜伏中か? 愛と荒らしの掲示板(逃亡先):http://bbs10.otd.co.jp/286214/bbs_plain http://tamae.5ch.net/test/read.cgi/php/1069245758/415
416: 未承諾広告※ ◆TWARamEjuA [sage] 04/05/05 18:55 ID:??? Rock54 対象の悪寒。 http://tamae.5ch.net/test/read.cgi/php/1069245758/416
417: nobodyさん [age] 04/05/06 22:18 ID:??? /^0?[0-3]?[0-7]{1,2}$/ってどんな意味ですか? http://tamae.5ch.net/test/read.cgi/php/1069245758/417
418: nobodyさん [sage] 04/05/06 23:08 ID:??? そのまんまだと思うのだが。 http://tamae.5ch.net/test/read.cgi/php/1069245758/418
419: nobodyさん [sage] 04/05/07 00:17 ID:??? 0377までの8進数 http://tamae.5ch.net/test/read.cgi/php/1069245758/419
420: nobodyさん [] 04/05/09 00:57 ID:R8gJ7rV0 perlをシフトJISで書いてるんですが、「表」とかの文字化けする文字を正規表現でマッチングさせる にはどうしたらいいでしょうか。 $_ =~ s/表/表\/g; みたいなことをしたいんですが上記の場合「表」のコードが(95 5C)なのでエラーに なってしまいます。コードのまま検索かけてもうまくいきませんでしたし $_ =~ s/95 5C/95 5C 5C/g; どうすれば「表」という一文字を検索に引っ掛ける事ができるでしょうか? http://tamae.5ch.net/test/read.cgi/php/1069245758/420
421: 420 [sage] 04/05/09 01:29 ID:??? 色々試していたら、デコードした後に下記のやり方で一応できたのですが、 $_ =~ s/\x95/表\/g; でも\x95だけでは他の文字にも影響が出てしまいますよね。それで $_ =~ s/\x95\x5C/g; としてみましたがこれではマッチしてくれませんでした。どうすればいいでしょうか。 http://tamae.5ch.net/test/read.cgi/php/1069245758/421
422: nobodyさん [sage] 04/05/09 01:45 ID:??? 要は文字化けしないようにエスケープしたいんじゃろ? 出力だけでなく処理もSJISでやってるなら展開しないように工夫すれ http://tamae.5ch.net/test/read.cgi/php/1069245758/422
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 567 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.025s