正規表現道場 Part2 (393レス)
正規表現道場 Part2 http://medaka.5ch.net/test/read.cgi/php/1348048723/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
148: nobodyさん [] 2014/03/02(日) 02:32:48.90 ID:2i/vkXtz htmlに対してとかじゃなくログに合わせろと http://medaka.5ch.net/test/read.cgi/php/1348048723/148
149: ◆QzqhRqBYxktP [sage] 2014/03/04(火) 19:52:20.08 ID:??? (>>146) (?:^|<br>) は分岐のバックトラックが残るから (?><br>|\A) としたほうが良さそう。 この2つは動作が完全なイコールではないので注意が必要、文頭が <br> だった場合に 絶対に \A がマッチ出来なくなるため。これが問題になることはほとんど無いだろうけど。 http://medaka.5ch.net/test/read.cgi/php/1348048723/149
150: nobodyさん [sage] 2014/03/05(水) 08:18:57.21 ID:??? (>>144) S05 ttp://perlcabal.org/syn/S05.html >Last Modified: 27 Feb 2014 Jeffrey Friedl ttp://regex.info/ Jeffrey Friedl - 第3版のコード ※ CGIなので直リンは避けたほうが良い。 regex.info/listing.cgi?ed=3&p=all 第2刷に対する正誤表 - 詳説 正規表現 第3版 ttp://www.oreilly.co.jp/books/9784873113593/#errata0 Google Books 詳説 正規表現 ※ 立ち読み可能 ttps://www.google.co.jp/search?tbm=bks&hl=ja&q=%E8%A9%B3%E8%AA%AC%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE http://medaka.5ch.net/test/read.cgi/php/1348048723/150
151: nobodyさん [sage] 2014/03/13(木) 06:24:42.94 ID:??? ascii抜粋 !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ http://medaka.5ch.net/test/read.cgi/php/1348048723/151
152: nobodyさん [sage] 2014/03/17(月) 17:00:03.12 ID:??? >>142 >Perl6 正規表現 I ここのサイト主、先読みを理解出来てないな・・。beforeとafterも逆だし。 http://medaka.5ch.net/test/read.cgi/php/1348048723/152
153: nobodyさん [sage] 2014/03/21(金) 12:20:24.42 ID:??? tes http://medaka.5ch.net/test/read.cgi/php/1348048723/153
154: nobodyさん [sage] 2014/03/22(土) 00:49:43.59 ID:??? windowsXP ショートカットのパス --------- C:\WINDOWS\system32\cmd.exe /k C:\test.pl6 --------- /k は実行後にウインドウを閉じないオプション。 拡張子 pl6 を perl6.exe に関連付けしておく。 test.pl6 にperl6のテストコードを書いて実験する。 http://medaka.5ch.net/test/read.cgi/php/1348048723/154
155: nobodyさん [sage] 2014/03/23(日) 15:15:41.32 ID:??? #!/usr/bin/perl6 my $str; $str := "AAABBBCCC"; say $str.trans( 'A'=>'a', 'B'=>'b', 'C'=>'c' ); say "\n"~$str; ---結果--- aaabbbccc AAABBBCCC http://medaka.5ch.net/test/read.cgi/php/1348048723/155
156: nobodyさん [sage] 2014/03/26(水) 20:28:04.50 ID:??? ### winXP で文字コードの 『et_EE.ISO8859-1』 を使えるようにする手順 !!! 試すときは仮想マシンを使うこと。環境が壊れて文字化けだらけになるため。 !!! 1、「コントロールパネル」 → 「地域と言語のオプション」 2、「日本語」 や 「日本」 と設定されている所を全て 「エストニア」 に設定する。 3、PC再起動 => perl から et_EE.ISO8859-1 が使用可能になる。 順番が s z t u に変わったことを確認。ただ、 [a-z] で t 以降もマッチするのは変わらず。 [FreeBSD] - 2005/9/3 ( => FreeBSD4.10? ) http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014529.html http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014531.html 正規表現 Part11 http://toro.2ch.net/test/read.cgi/tech/1363769640/330,325 http://medaka.5ch.net/test/read.cgi/php/1348048723/156
157: nobodyさん [sage] 2014/03/26(水) 22:02:12.05 ID:??? FreeBSD - 2005/9/5 http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014529.html http://lists.freebsd.org/pipermail/freebsd-bugs/2005-September/014531.html 正規表現 Part11 http://toro.2ch.net/test/read.cgi/tech/1363769640/330,325 [[ winXPで et_EE.ISO8859-1 を使う ]] 1、「コントロールパネル」 => 「地域と言語のオプション」 2、「日本」 「日本語」 を全て「エストニア」 に変更。 3、PC再起動 perlで s z t u の順になるのを確認。しかし [a-z] が t u 以降にもマッチするのは変わらなかった。 => 順番が変わることによるトラブルを避けるために対策されている? ※ これをやると環境の一部がエストニア語で上書きされ日本語に戻せなくなるので 試すなら 「VM ware」 や 「Virtual PC」 等の仮想マシンで試しましょう。 2005/9/5 に問題報告がされているのでそれ以前にリリースされたFreeBSDを使って試せば 完全に再現出来る可能性大。そして 4.11で再現出来なくなっていれば対策が取られたということになる。 http://medaka.5ch.net/test/read.cgi/php/1348048723/157
158: nobodyさん [sage] 2014/03/30(日) 04:03:56.61 ID:??? --------c:\test.pl----------- use locale; print +(sort grep /[a-z]/i, map { chr } 0..255), "\n"; --------c:\test.pl----------- C:\>perl test.pl aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsSzZtTuUvVwWxXyY C:\>perl -v This is perl 5, version 16, subversion 3 (v5.16.3) built for MSWin32-x86-multi-thread ----------------------------------- ↓これを使わなくても順番が変わった。 use POSIX qw(setlocale LC_ALL); setlocale(LC_ALL, "et_EE.ISO8859-1"); コンパネで「エストニア」と指定しただけで「et_EE.ISO8859-1」は未指定の状態。 ----------------------------------- /[a-z]/i を /\w/ に変えると英字以外の文字も英字の間に 挟まっていることが確認出来る。 http://medaka.5ch.net/test/read.cgi/php/1348048723/158
159: nobodyさん [sage] 2014/03/30(日) 04:24:51.20 ID:??? --------c:\test.pl----------- use locale; # これが無いと順番が変わらない use POSIX qw(setlocale LC_ALL); # コメントアウトしても変化なし setlocale(LC_ALL, "et_EE.ISO8859-1"); # コメントアウトしても変化なし my $abc; $abc = "STU"; $abc =~ s/[A-Z]/hit/g; print $abc."\n"; --------c:\test.pl----------- [結果] hithithit 順番が変わっていれば S にしかマッチしないはずだが3文字すべてに マッチしている。 LC_ALL を LC_CTYPE や、 LANG などに変えたり、test.plを保存するときの 文字コードをutf-8からshift_jisに変えたりしても結果変わらず。 XPsp3+perl5.16.3の環境で S だけにマッチさせる手段は無いと思われる。 http://medaka.5ch.net/test/read.cgi/php/1348048723/159
160: nobodyさん [sage] 2014/03/30(日) 05:25:46.81 ID:??? >>156 「辞書順」はロケールに依存するが「文字コード順」は文字コードに依存する、んじゃね? 文字集合の範囲指定が文字コード順と定義されているなら、 いくらロケール切り替えても文字コード切り替えない限り無意味だろう。 で、文字集合の範囲指定ってどっちだと定義されてるの? http://medaka.5ch.net/test/read.cgi/php/1348048723/160
161: nobodyさん [sage] 2014/03/30(日) 14:02:22.42 ID:??? >>160 俺はロケールや文字コードの知識はほとんど無いんでよく分かってない。 ↓は winXPsp3 + perl5.16.3 + ロケール = 「日本」 の環境での実験結果。 ・ [ァ-ィ] が ア にマッチするか実験。( 文字コード順ならマッチしないはず ) ---------------------------------------- use locale; if ( "ア" =~/[ァ-ィ]/ ){ print "hit\n"; } else { print "no hit\n"; }; ---------------------------------------- 結果: hit ( マッチしたので文字コード順ではない ) この環境での範囲指定は↓の順みたい。これはshift_jisの並び順とは違う。(これが辞書順?) ---------------------------------------- _0123456789aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYzZァアィ スセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン ---------------------------------------- 文字コードでなくロケールに依存するという発想は思い付かなかったわ、そっちの線で また実験しながら遊んでみるよ、辞書順とやらも調べてみる。ヒントありがとう。 http://medaka.5ch.net/test/read.cgi/php/1348048723/161
162: nobodyさん [sage] 2014/03/31(月) 00:44:57.15 ID:??? (>>156) ついに [a-z] が t 以降にマッチしない動作の再現に成功! et_EE.ISO8859-1 の代わりに et_EE.ISO8859-15 を使ったら再現出来ました! 今まで助言をくれたみなさんありがとう〜。自分一人じゃ絶対無理だった。 ↓こちらの方々にも感謝〜 初心者もOK! FreeBSD質問スレッド その117 http://toro.2ch.net/test/read.cgi/unix/1380865524/938-954n 詳しい手順はもう少し調べて整理してから載せます。 http://medaka.5ch.net/test/read.cgi/php/1348048723/162
163: nobodyさん [sage] 2014/04/01(火) 22:34:44.19 ID:??? 正規表現道場 in ジオシティーズ http://akiba.geocities.jp/hp20140401/ とりあえず場所確保。 http://medaka.5ch.net/test/read.cgi/php/1348048723/163
164: nobodyさん [sage] 2014/04/12(土) 17:21:41.17 ID:??? 2ch .scに移転しました。 正規表現道場 Part2 http://nozomi.2ch .sc/test/read.cgi/php/1348048723/l50 ■ 2ch.netの問題点 ・ 2chscがNGワードになってるので正規表現をスレに貼るのに支障が出る。何より言論統制はイクナイ。 ・ 管理人が今後どう動くか予測が付かない。 自暴自棄になりIPや書き込み履歴を大公開して逃走する可能性すらある。会社IPの人は注意。 http://medaka.5ch.net/test/read.cgi/php/1348048723/164
165: nobodyさん [] 2014/04/12(土) 20:53:07.28 ID:kZRku0LV もうこっちに帰ってくるなよ http://medaka.5ch.net/test/read.cgi/php/1348048723/165
166: nobodyさん [] 2014/04/15(火) 11:21:18.41 ID:qQPWwAKL 使用しているのはYahoo! Pipesのregexです http://d.hatena.ne.jp/dacs/20080422/1208868051 ○○/△△&#xd;[□□ という文字列から△△だけを抜き出したくて、色々試してみているのですがどうもうまくいきません ".*/" -> replace -> "" "\&#xd;.+" -> replace -> "" だと思うのですが、何か間違いがあるのでしょうか? ちなみに "[.+" -> replace -> "" も試してみましたがダメでした http://medaka.5ch.net/test/read.cgi/php/1348048723/166
167: nobodyさん [] 2014/04/15(火) 20:38:11.07 ID:CfZz5H/X Yahoo! Pipesの仕様なんて知らんが 文字列の開始も終わりも指定してないということは .*/で一番最後の/までが対象として消える可能性はある http://medaka.5ch.net/test/read.cgi/php/1348048723/167
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 226 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.666s*