正規表現道場 Part2

[過去ﾛｸﾞ] 正規表現道場 Part2 (466ﾚｽ)
上下前次 1-新

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

86: 2014/01/19(日)17:13 ID:???.net AAS
>>83
>>82の内容を理解出来てないね・・

(?:(?!foo).)*　→　fo にマッチ
o$　→ o にマッチ

これ足して foo にマッチ「する」のが期待する文字列否定の動作。
fo の中に foo は含まれていないので fo にはマッチしなければならない。

＞関数使うべき
マラソン選手に車使うべきって言ってるようなもん。

87: 2014/01/21(火)04:23 ID:???.net AAS
正解はこちら↓

Perl正規表現雑技 - ある文字列を含まないものにマッチする正規表現
外部ﾘﾝｸ[htm]:www.din.or.jp

88: 2014/01/24(金)01:21 ID:???.net AAS
うーむ、オートマトンの勉強というか、まだ触りしか学んでないんだが
既に文字列否定の正規表現を簡単に作れるようになってしまった。

チャリの運転と同じで、一旦出来るようになるとなんてことないね。

89: 2014/01/24(金)05:08 ID:???.net AAS
（次のお題）

abc　かつ　def　を含まない文字列を表す正規表現を作れ。ただし先読みはNG。

90(1): 2014/01/25(土)14:00 ID:peRg4Ln+.net(1) AAS
お題が提示されておりますが、質問よろしいでしょうか。
言語は Java（Android開発）です。

やりたいことは、
　・'a', 'b', 'c', '*' の４つの文字が使われた文字列を分割する
　・'a*', 'b*', 'c*' は１文字として扱い、'*'のみの物は無い
になります。

例えば "aba*cb*" の場合は
a
b
a*
c
b*
に分割したいです。

どのように書けば良いのでしょうか、ご教授願います。

91(1): 2014/01/25(土)17:37 ID:VUYYCfMh.net(1) AAS
([abc]\*?)

92(1): 2014/01/26(日)00:17 ID:???.net AAS
このスレは道場と名の付いてる通り正規表現のスキルアップを目指すスレです。

糞質問・キチガイは↓こちらにお願いします。

Regular Expression(正規表現) Part12
2chｽﾚ:tech

93: 90 2014/01/26(日)13:40 ID:???.net AAS
>>91
ありがとうございました。勉強になります。

>>92
>>1も読めない糞は2chには向いていないと思うよ。
もう何十年も居座っていると予想されるが、そろそろ自覚しなよ。

94: 2014/01/26(日)23:09 ID:???.net AAS
ここはもう荒らしの本拠地になってるから仕方がないよ。
わざわざ煽りにム板まで出張してきてるし。

95: 2014/01/27(月)00:48 ID:???.net AAS
こちらは精神異常者の隔離スレとなっております

96: 2014/01/27(月)05:05 ID:???.net AAS
じゅんじゅんのきまぐれ
外部ﾘﾝｸ:d.hatena.ne.jp

おや、あわわさんとやらが俺の代わりに知らせに行ってくれてたのか。
あわわさん乙。ありがとう。

正規表現 Part11
2chｽﾚ:tech

ってあれ？あわわさんのほうが６時間早い。CPU時計の時差？

97: 2014/01/29(水)03:59 ID:???.net AAS
レベル高いスレにただいま。

98: 2014/01/29(水)04:05 ID:???.net AAS
荒らしの住み処
ただのクソスレ

99(1): 2014/01/29(水)05:11 ID:???.net AAS
ところで向こうの２６７は雑技たんなのかな？２６６、雑技のネタに使ってもよかですたい。

100(1): 2014/01/29(水)08:45 ID:???.net AAS
>>99
当たりw
266の書き方は考えたけど，今回のケースでは267の書き方で大丈夫と考えた．
そういや質問者は「1」を含まないって書いてあるのに，なぜ「123」? とは思ったなw

後ろに他の正規表現を続けたりするとバックトラックして，
271の通りの可能性があるから初心者には266の方がいいのは確か．

ただ，他にもいろいろ考え出すと，最も内側のものだけ削除したいのなら，
ABC(?:(?!123|ABC|DEF).)*DEF
と書いた方がいいとかもある．

ちなみに266のミソは↓の辺りで微妙に使っていたりする．
外部ﾘﾝｸ[htm]:www.din.or.jp

101(1): 2014/01/29(水)15:23 ID:???.net AAS
>>100
ああ、考えてみればABCも入れたほうがいいね。質問者の対象データが対になってる
データだったから必要性を感じなかったが入れるべきだった、さすが雑技たん。

＞なぜ「123」?
1というのは実データとは違う省略形と考えた。
初心者には文字と文字列の違いが分からないから文字列のつもりで1と書いてしまった
可能性がある。そこで文字列に対応しておけば1文字にも対応出来るってわけ。

＞ABC(?:(?!123|ABC|DEF).)*DEF
これが基本形やね。高速化するなら*+とか、もっとやるなら[^1AD]*+使ってごちゃごちゃ書いたり。

＞NoEnd
ミソは否定の中に分岐を入れることだからそれとはちょっと違うｗ
それと　<\2>　だと　　になってしまうで・・　<\2\b　やね。

102(1): 2014/01/30(木)00:29 ID:???.net AAS
>>101
＞1というのは実データとは違う省略形と考えた。
なるほど．確かに，初心者ほど状況説明が下手だからね．

＞それと　<\2>　だと　　になってしまうで・・　<\2\b　やね。
単純なミスだな．指摘ありがとう．

103(2): 2014/01/30(木)07:11 ID:???.net AAS
・範囲内で文字列を含まない正規表現

$_ = "zzzABC XYDEFzzDEFz";
if ( m/
# Perl 5.10 以降で有効
ABC
[^XAD]*
(?:
(?!XYZ|ABC|DEF).
[^XAD]*
)*
(*PRUNE) # バックトラックステートの削除
(*SKIP) # 次回の走査開始位置をここに飛ばす
(?:XY?)? # XYZとDEFの競合を想定した取りこぼし回収
DEF
/xgsiaap )
{ print "match! <".${^MATCH}.">"; }
else
{ print "no match."; }

>>102
修正乙！

104(1): 2014/01/30(木)13:46 ID:???.net AAS
修正乙の後でアレなんだけど、実際に動かしてみたらだいぶおかしいから手直ししてみたよ、と。

while ($html =~ /
<(NOBR|CODE|B|PRE|FONT)\b

(?=
(
(?:(?!<\/\1>).)*?
(?:<\1\b|$)
)
)
/sixg

) {
print "<".$1.$2, "\n";
}

------------- perl.htm -------------
<pre>aaa
------------- perl.htm -------------

*? はなるべく使いたくないなぁ・・ [^<]*+ を使って最適化したいｗ

105(1): 2014/01/31(金)02:30 ID:???.net AAS
>>103
(*VERB:ARG) ってのは知らなかったなぁ．
今回のケースだと(*PRUNE)は(?>pattern)で置き換えができると思うが，
マニュアルの「(*PRUNE) は (?>pattern) 単独では表現できないケースを扱うために使えます。」ってのがどういうケースなのか想像できん．

>>104
修正ありがと．
元のやつだと後ろを吸い込んじゃうからマッチ位置が先に進んでしまう．
そうならないように先読みを使うと，先読み部分は後方参照に含まれなくなるから，先読みの中で改めて補足が必要って感じだね．

106(1): 2014/01/31(金)04:37 ID:???.net AAS
>>105
>単独では
・・・　(　・・・ (*PRUNE)　)
みたいに ( ) で分断されてる場合とか？ (?> だと２つ以上必要になる。

>マッチが先に
当たり～。printのとこは""の中にまとめて書いても大丈夫だったのか、勉強になりますた。
改めて修正乙。

107(1): 2014/01/31(金)10:29 ID:???.net AAS
>>103
「XYZとDEFの競合」ってのはXYZの後半部分がDEFの前半部分と同じ場合ってことかな？
例えば，xydとdef，とか，xdeとdefみたいな

もしそういう，後半部分と前半部分が重なる場合を考え出すと，話がもう少しややこしくなる．

つまり，ABCDとCDEFがキーだったときに，ABCDEFという文字があったら，
それはABCD+EFと解釈するのか，AB+CDEFと解釈するのか，という問題．

その解釈がすべて前方優先なのか，すべて後方優先なのか，それともキーの相互の優先度で決まるのか，
あるいは，あらゆる可能性を許すのか，あらゆる可能性を許さないのか．

キー自身が重なる場合もある．
例えば，ABCABみたいなキーだったとき，ABCABCABは，ABCAB+CABなのか，ABC+ABCABなのか．

108(1): 2014/01/31(金)10:34 ID:???.net AAS
>>106
＞・・・　(　・・・ (*PRUNE)　)
なるほど，括弧の深いところで使うと，(?> で表現するのは大変そうだ．
しかも，もしそれが中間レベルで分岐してたりすると，(?> では表現しきれないかな．

109: 2014/01/31(金)16:13 ID:???.net AAS
>>107
ぶっちゃけその辺は何も考えてない。試作品とかテンプレートみたいな感じで作っただけ。
競合対策の部分は普通の使い方をするならいらないね、HTMLやXMLタグで挟まれた文字列にマッチさせるときとか。
こういうの以外に使い道が思い当たらないし。（だったら付けるな）

>>108
＞分岐
なるほど、(?> ではお手上げだ。俺も年末に覚えたばかりでよく分かってない。

110: 2014/02/01(土)16:48 ID:???.net AAS
## (*COMMIT)

$_ = "12";
if (
m/^1((*COMMIT)3|2)/
){ print "match!\n"; }
# 分岐の中で踏まれると以後ほかの分岐要素を走査することがなくなる。
# 現在の分岐要素がマッチ失敗したら全体もマッチ失敗となり検索はそこで完全終了する。

m/^1(*COMMIT)(3|2)/
# 下位層の分岐は走査され、マッチが成功する。

$_ = "12";
@test = $_ =~ m/^1(*COMMIT)A|\d/g;
print "@test\n";
# /g でも次位置からの走査は行われない。

@test = $_ =~ m/^1(*COMMIT)|\d/g;
# 結果 = 1 2 。マッチが成功した場合は走査を止めることはない。(失敗したときだけ止める)

111(1): 2014/02/01(土)17:24 ID:???.net AAS
Q、(*COMMIT) とは逆にマッチが成功したときだけ /g を止める最も簡単な手段は何か？

$_ = "123";
@test = $_ =~ m/1|2|3/g;
print "@test\n";

↑2 がマッチ成功したときに /g を止め、3がマッチしないようにする。
フラグ変数を用意、チェックすれば可能だがもっと手軽な手段はないか。

112(2): 2014/02/02(日)07:59 ID:???.net AAS
う～ん、/g はループなのに break する方法が用意されていない。
COMMIT があるのにこれがないのはとても不可解だ。

# 先読みの中の (*SKIP) は機能しない。
@test = $_ =~ m/1|2(?=.*(*SKIP))|3/g;

# while 文の last を使う。
$_ = "123";
while ( m/1|2|3/gp )
{ print "${^MATCH}\n";
last; } # 1 で止まる。

# (?{code}) で last → 効果なし
while ( m/1|2(?{ last; })|3/gp )

# while 文に名前を付けて (?{code}) で last → 効果なし
TEST : while ( m/1|2(?{ last TEST; })|3/gp )

perl陣営に言えば新しいコマンド作ってくれそうだなぁ。

113: 2014/02/02(日)08:47 ID:???.net AAS
# (?-g) → 効果なし
while ( m/1|2(?-g)|3/g )

# 苦肉の策 (現実的でない)
while (
m/(1)|(2).*|(3)/g
)
{ print "${^N}\n"; }

# 苦肉の策 + 最後の空文字列にマッチしない対策 (現実的でない)
while (
m/\z(*COMMIT)(*F)|(1)|(2).*|$/g
)
{ print "match! ${^N}\n"; }

114(1): 2014/02/02(日)10:19 ID:???.net AAS
>>111
>>112 >>123
/g がループというのはちょっと違う．
リストコンテキストで評価したときはループと言えるが，スカラーコンテキストで評価したときはループではなく，
単に前回マッチした場所を覚えていて続きからマッチングを行うというだけ．

この問題はリストコンテキストで /g を評価したときに，マッチ成功後に途中で止めるいい方法はないかって言う問題だと解釈した．
スカラーコンテキストで評価したときに止めるんなら last を使えば簡単に止まる話．

つまり，while を使っていいんなら，
while (/1|2(*:STOP)|3/g) {
push(@test, $&);
last if $REGMARK eq 'STOP';
}
print "'@test'\n";

リストコンテキストで評価したときに途中で止めるには，かなり条件が限定されるが，
@test = $_ =~ m/(?(?<=2)\G(*COMMIT)(*FAIL))(?:1|2|3)/g;
ぐらいしか思いつかなかった．
これではフラグを使った方が簡単だろう．

115: ◆QzqhRqBYxktP 2014/02/02(日)14:00 ID:???.net AAS
>>114
＞ループというのはちょっと違う
そのへんはちゃんと理解してるから大丈夫。foreachとか<>みたいなつもりで書いてるから。

＞リストコンテキストで /g を評価したときに，マッチ成功後に途中で止めるいい方法はないか
その通り。

＞(*:STOP)
これはフラグ変数を使うやり方とまったく同じだからボツ・・。{ } の中で last するのはナシ。
m/ / の中で止められないか、という話だから。

しかも$REGMARKと$REGERRORは予期しない動きをすることがあるから
普通にフラグを使ったほうが確実。（後述）

＞これではフラグを使った方が簡単だろう
やっぱそうかぁ、雑技たんでもダメなら無理そうだね。考えてくれてありがとう。

116: 2014/02/02(日)14:08 ID:???.net AAS
## $REGERROR

# マッチ失敗でも$REGERRORが偽を返す例
$_ = "11";
m/^(*MARK:NAME)12/;
if ($REGERROR){ print "yes\n" }else{ print "no\n"; };

結果 → no

# 2 を (?!) や (*FAIL) に変えると・・？
m/^(*MARK:NAME)1(?!)/;

結果 → yes

2 を $ にすると no のまま。

117(1): 2014/02/02(日)14:12 ID:???.net AAS
あれ、$REGMARK が予期しない動作になるデータはないや。
ごめん、使えないのは $REGERROR だけかも。

118(1): 2014/02/02(日)14:30 ID:???.net AAS
＞単に前回マッチした場所を覚えていて続きからマッチングを行うというだけ

あ、ちゃう、これ分かってなかった。場所覚えてるだけだったのか、違和感感じてたんだけど
やっと理解出来たよ、ありがとう。

あと雑技たんのサイトだけど
＞回文にマッチする正規表現　# 再帰版

×　(??{$palindrome})*
○　(??{$palindrome})?

だね。前者だと回文を繋げた文字列 121454989・・・みたいなのを拾ってしまう。

119(1): 2014/02/02(日)20:34 ID:???.net AAS
>>117
確かに $REGERROR は期待通りに動かないな．

>>118
回文の間違い指摘ありがとう．

120: ◆QzqhRqBYxktP 2014/02/02(日)20:50 ID:???.net AAS
おや、出来ちゃった・・

# リストコンテキスト＋ /p のマッチング中に break する。
$_ = "123";

@test = $_ =~ m/
1
|2
(?{ $last = "${^MATCH}"; })
(*COMMIT)(*F)
|3
/xgp;

push(@test,$last);
print "@test\n";

# リストコンテキスト＋ /p のマッチング中に break する。( push版 )
push(@test,
m/
1
|2
(?{ $last= ${^MATCH}; })
(*COMMIT)(*F)
|3
/xgp
,
$last
);

>>119
仕事はやっ！修正乙～

121: ◆QzqhRqBYxktP 2014/02/03(月)07:41 ID:???.net AAS
↑× /p のマッチング中に　→　/g の間違い
----------------------------------------------
# 先読みの中の (*SKIP) は正しく機能する。(× >>112)

$_ = "123";
@test = $_ =~ m/1|2(?=.*\z(*SKIP)(*F))|3/g;
print "@test\n";
# 結果 → 1

# 先読みの中の (*SKIP) が失敗する例もある
@test = $_ =~ m/1|2(?=.*\z(*SKIP))(*F)|3/g;
# 結果 → 1 3
# perl内部の最適化の影響により (?=) より早く (*F) が判定されている？
# $REGERROR が期待通りに動かない原因も最適化が犯人？ (最適化は詳説正規表現参照)

----------------------------------------------

# \z で始まる正規表現 + while( /g )
while (
m/\z(?{ print "in code\n"; })/g
)
{ print "match!\n"; }

<結果>
in code
match!
in code

2回走査されてる。2回目は走査しといてマッチ失敗。/g により1つ先に進む動作の副作用？
(?{code}) が2回実行されるのでプログラムが想定外の動作になる可能性。
/g を忘れると走査開始位置が毎回先頭に戻り、無限ループになる。

122: 2014/02/03(月)17:57 ID:???.net AAS
# リストコンテキスト＋ /g のマッチング中に break する。(perl 旧verl対応版)

$_ = "12223";

@test = $_ =~ m/
1
|2
(?{ $last = "$&"; })
.*\z # 余った文字列を全部マッチさせる。
|3
/xgs;

$test[$#test] = $last; # 最後の要素の入れ替え
print "@test\n";

これらを "break出来てる" と言うのはちょっとおこがましいかも知れない。やはり break コマンドが欲しい。

123(1): ◆QzqhRqBYxktP 2014/02/04(火)13:37 ID:???.net AAS
・$REGERROR を (?{code}) と入れ替えて実験

my $cnt = 0;
$_ = "11";
m/^(?{ $cnt++;})1(*F)/;
print "$cnt\n";
# 結果 → 1

my $cnt = 0;
$_ = "11";
m/^(?{ $cnt++;})12/;
print "$cnt\n";
# 結果 → 0

$REGERROR さんに無罪判決。冤罪でした。

124(2): 2014/02/04(火)13:39 ID:???.net AAS
皆様、こんにちは　質問させてください

テキスト内の文字を置き換えるアプリ（Devas）で作業をしています
正規表現で文字検索と置き換えしたいのですが表現法がわかりませんので
詳しい方アドバイス下さいませんでしょうか？

テキスト内には

.（ドット）abc"IMG
.（ドット）def"IMG
.（ドット）ghr"IMG

など　.　と　"IMG　で囲まれた数パターンの文字列がありこれに元文字列を利用し .photo を付け加えたいのです

.（ドット）.photo.abc"IMG
.（ドット）.photo.def"IMG
.（ドット）.photo.ghr"IMG

検索、置き換え　共に正規表現が使えるアプリなのですがそれぞれどう表現して良いのか教えてくださいませんか？
よろしくお願いいたします　

125(3): ◆QzqhRqBYxktP 2014/02/04(火)13:41 ID:???.net AAS
・開始タグと閉じタグの間に文字列を含まない正規表現 (正規表現否定除く)

$_ = "ABC ABC DEF ABCDEF";

while ( m/
# Perl 5.10 以降で有効
ABC
[^ADX]* # 先頭の文字を使った高速処理
(?:
(?:
DEF (*ACCEPT) # マッチ成功
|\K ABC # 今までマッチした文字列を捨ててリスタート
|XYZ (*PRUNE) (*SKIP) (*F) # NGワード検出、マッチ失敗
|. # ↑の３つ以外の１文字
)
[^ADX]*
)*
(*COMMIT) (*F) # DEFで閉じられないまま終端に到達。
/xgsiaap )

{ print "match! <${^MATCH}>\n"; }

# NGワード、開始タグ、閉じタグの競合は想定していない。
# 例、NGワード="</" 、閉じタグ="</div>"

126: 2014/02/04(火)20:09 ID:xuvSG1oC.net(1) AAS
s/^\./.photo./g
行頭限定の場合

127: ◆QzqhRqBYxktP 2014/02/05(水)16:22 ID:???.net AAS
>>124
<検索>
\.([a-z\d]{1,4}"IMG\b)
<置換>
..photo.$1

\. を ( ) に入れてないのは処理効率を上げるため。
「abc」の部分は拡張子と考えて数字も許可した。(1文字以上4文字以下の英数字)

何かまずかったら遠慮なく。

128(1): 124 2014/02/06(木)18:00 ID:???.net AAS
たくさんレスいただきましてありがとうございます
お礼が遅れまして申し訳ありません

127様の　\.([a-z\d]{1,4}"IMG\b)　で無事検索できることができました
しかし置き換えでは　マッチした文字列が　..photo.$1　に置き換わるだけで　$1にマッチした語句が適応されません

検索結果
○○○○○○.abc" IMG が　○○○○○○..photo.$1　となります
希望では
○○○○○○.photo.abc" IMG となることです（単純に　.拡張子　前に　.photo を入れたい）

先の書き込みでの訂正がありました　申し訳ありません
検索したい文字列には　" と　IMG　の間に半角スペースがありました

半角があっても上手く検索にひっかっかっていますが
上手く置き換えができないのはこの半角が原因なのでしょうか？

引き続きご指導いただければ幸いです　よろしくお願いいたします

129(1): ◆QzqhRqBYxktP 2014/02/06(木)20:27 ID:???.net AAS
>>128
ごめんなさい、こちらにも見落としがいくつかありました。
（ Devasにはメジャーな正規表現エンジンが使われていると考えて作りましたが違ったようです）

・通常版 (上行=検索、下行=置換)
\.[a-zA-Z\d]{1,4}" ?IMG\b
.photo\0

・拡張子を小文字に変換する版 (例 .JPG → .jpg )
\.([a-zA-Z\d]{1,4})(" ?IMG\b)
.photo.\L\1\E\2

・「"」と IMG の間のスペースがあっても無くてもスペース１個にする版
\.([a-zA-Z\d]{1,4})" ?IMG\b
.photo.\L\1\E" IMG

# \L と \E を削除すれば拡張子の小文字変換はしなくなります。
# 本当は .photo.photo.jpg のような複数回置換による重複を防ぎたかったんですが
# この正規表現エンジンでは無理なようです。(>_<)

130: 2014/02/06(木)22:22 ID:???.net AAS
>>129
度々のレスありがとうございます

正規表現エンジンにもいろいろなものがあるとは知りませんでした
お手数をおかけいたしまして申し訳ありません

いくつものパターンを示してくださいまして　
重ねて感謝いたします

通常版にて理想の変換ができました
今回教えて頂いたような知識を深めて、もっと便利にPCを使えるようになりたいと思います

勉強になりました　ありがとうございます　m(_ _)m

131: 2014/02/09(日)02:41 ID:???.net AAS
質問させてください。
phpのpreg_match関数でwebページから文字列を抽出したいと考えています。
以下を使用して抽出していますが、改行が含まれると抽出ができませんでした。

$text = '/value="(.*?)" id="latest"/';
preg_match($text, $source, $matches);
$word = $matches[1];

色々調べて$textを以下のようにしてみましたが、うまくいきませんでした。
$text = '/value="(.*?)" id="latest"/s';
$text = '/value="([\s\S]*?)" id="latest"/';
$text = '/value="((\n|.)*?)" id="latest"/';

何故うまくいかないのかよくわかりません。
なにかアイデアはありませんでしょうか？

132: 2014/02/09(日)08:07 ID:J9pikab5.net(1/2) AAS
俺なら
/value="([^"]*)"\s+id="latest"/

133: ◆QzqhRqBYxktP 2014/02/09(日)17:20 ID:???.net AAS
× ' '
○ " "

というオチ？PHPは触らないから分からない。

134: 2014/02/09(日)17:39 ID:J9pikab5.net(2/2) AAS
PHPなんか触らないから分からないけど両端のすらすらが余計とかなんかね

135: ◆QzqhRqBYxktP 2014/02/09(日)18:09 ID:???.net AAS
ごめんなさい、PHPの解説サイト見たら ' ' でOKでした。

136: 2014/02/11(火)10:03 ID:???.net AAS
PHPスレで聞いたほうが早いかも。原因が改行以外にある可能性も十分あるので
動かないサンプルコードをアップして見てもらえば確実に原因教えてもらえると思う。

137: 2014/02/11(火)13:41 ID:???.net AAS
↑$source に入るHTMLファイルも見ないと原因が分からない可能性アリ。

138: ◆QzqhRqBYxktP 2014/02/13(木)23:18 ID:???.net AAS
再帰と　(?( ) yes|no)　の組み合わせが楽しすぎる。もしかしたら宝の山かも。
マトリョーシカの中にダルマを入れられる感じ。

139: 2014/02/15(土)18:56 ID:???.net AAS
正規表現メモ
外部ﾘﾝｸ[html]:www.kt.rim.or.jp
「調整中」

気付いてもらえたのかそうでないのかいまいち分からんす。
このサイトはあんまアテにしないほうが良さそうだ。

140: ◆QzqhRqBYxktP 2014/02/16(日)14:59 ID:???.net AAS
>>125 の疑問点

\K が分岐の先頭にあることで処理速度に遅れが出るかどうか調べる。
また、\K を使わない書き方とどちらが早いか調べる。

141: ◆QzqhRqBYxktP 2014/02/16(日)15:40 ID:???.net AAS
比較対象追加 ( >>125 ) | (?=ABC) \K ABC

142(1): ◆QzqhRqBYxktP 2014/02/16(日)20:56 ID:???.net AAS
( >>125 ) | (?=ABC) \K ．．．

Perl6 正規表現 I
外部ﾘﾝｸ[html]:dl.dropboxusercontent.com

143: ◆QzqhRqBYxktP 2014/02/17(月)00:27 ID:???.net AAS
Perl6::Overview::Rule
外部ﾘﾝｸ[pod]:search.cpan.org

[foo|bar]+

Perl6ではこれが正しい書き方になるらしい。初心者がハマりそう・・罠的な意味で。

先読み、戻り読みは書きにくくなった感が否めない。
文字クラスも加算、減算をしないときでも <> で囲う必要があるのはめんどくさい。

が、新しいオモチャとしては十分楽しめそう。ついでに英語も覚えてしまおう。

144(1): ◆QzqhRqBYxktP 2014/02/22(土)00:25 ID:???.net AAS
S05
外部ﾘﾝｸ[html]:feather.perl6.nl
> Last Modified: 11 Feb 2014, Version: 174

A05
外部ﾘﾝｸ[pod]:search.cpan.org
> Last Modified: 18 May 2006, Number: 5, Version: 7

perl6ではもはや正規表現ではないという意味を込めて「regex」と呼んでるらしい。
perl5の正規表現にあった「ゴチャゴチャ感」が綺麗に一掃されてる感がある。

:ratchet があるのは最高だなぁ。

145(1): 2014/03/01(土)19:39 ID:n8n41uDi.net(1/2) AAS
2chｽﾚ:applism
2chｽﾚ:applism
この書込の方を正規表現でNGにしたいと思っています。

条件は
最初の行とは限らないが、「・」で初める行がある。何文字かの後、改行
その次の行は空の行
この2セットを正規表現で表すにはどうすればいいでしょうか？

.*?・.*?\r\n\r\n
としてみましたがダメでした。

146(2): ◆QzqhRqBYxktP 2014/03/01(土)20:13 ID:???.net AAS
>>145
２ｃｈブラウザ用でいいのかな？処理速度重視で作った。

(?:^| )(?>\s*)・(?>[^<]*(?:(?! ).[^<]*)*) (?>\s*)

147: 2014/03/01(土)20:45 ID:n8n41uDi.net(2/2) AAS
>>146
素敵！
神！
すっきりしました！
テキストじゃなくhtmlに対して正規表現だったのですね、勉強になりました。
ありがとうございました！

148: 2014/03/02(日)02:32 ID:2i/vkXtz.net(1) AAS
htmlに対してとかじゃなくログに合わせろと

149: ◆QzqhRqBYxktP 2014/03/04(火)19:52 ID:???.net AAS
(>>146)
(?:^| ) は分岐のバックトラックが残るから (?> |\A) としたほうが良さそう。

この２つは動作が完全なイコールではないので注意が必要、文頭が だった場合に
絶対に \A がマッチ出来なくなるため。これが問題になることはほとんど無いだろうけど。

150: 2014/03/05(水)08:18 ID:???.net AAS
(>>144)
S05
外部ﾘﾝｸ[html]:perlcabal.org
>Last Modified: 27 Feb 2014

Jeffrey Friedl
外部ﾘﾝｸ:regex.info

Jeffrey Friedl - 第３版のコード ※ CGIなので直リンは避けたほうが良い。
regex.info/listing.cgi?ed=3&p=all

第2刷に対する正誤表 - 詳説正規表現第3版
外部ﾘﾝｸ:www.oreilly.co.jp

Google Books 詳説正規表現 ※ 立ち読み可能
外部ﾘﾝｸ:www.google.co.jp

151: 2014/03/13(木)06:24 ID:???.net AAS
ascii抜粋

!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~

152: 2014/03/17(月)17:00 ID:???.net AAS
>>142
＞Perl6 正規表現 I

ここのサイト主、先読みを理解出来てないな・・。beforeとafterも逆だし。

153: 2014/03/21(金)12:20 ID:???.net AAS
tes

154: 2014/03/22(土)00:49 ID:???.net AAS
windowsXP ショートカットのパス

---------
C:\WINDOWS\system32\cmd.exe /k C:\test.pl6
---------

/k は実行後にウインドウを閉じないオプション。
拡張子 pl6 を perl6.exe に関連付けしておく。
test.pl6 にperl6のテストコードを書いて実験する。

155: 2014/03/23(日)15:15 ID:???.net AAS
#!/usr/bin/perl6
my $str;
$str := "AAABBBCCC";
say $str.trans( 'A'=>'a', 'B'=>'b', 'C'=>'c' );
say "\n"~$str;

---結果---
aaabbbccc

AAABBBCCC

156(2): 2014/03/26(水)20:28 ID:???.net AAS
### winXP で文字コードの『et_EE.ISO8859-1』を使えるようにする手順

!!! 試すときは仮想マシンを使うこと。環境が壊れて文字化けだらけになるため。 !!!

１、「コントロールパネル」　→　「地域と言語のオプション」
２、「日本語」　や　「日本」　と設定されている所を全て　「エストニア」　に設定する。
３、ＰＣ再起動

=> perl から et_EE.ISO8859-1 が使用可能になる。

順番が s z t u に変わったことを確認。ただ、 [a-z] で t 以降もマッチするのは変わらず。

[FreeBSD] - 2005/9/3 ( => FreeBSD4.10? )
外部ﾘﾝｸ[html]:lists.freebsd.org
外部ﾘﾝｸ[html]:lists.freebsd.org

正規表現 Part11
2chｽﾚ:tech

157: 2014/03/26(水)22:02 ID:???.net AAS
FreeBSD - 2005/9/5
外部ﾘﾝｸ[html]:lists.freebsd.org
外部ﾘﾝｸ[html]:lists.freebsd.org

正規表現 Part11
2chｽﾚ:tech

[[ winXPで et_EE.ISO8859-1 を使う ]]

１、「コントロールパネル」 => 「地域と言語のオプション」
２、「日本」「日本語」を全て「エストニア」に変更。
３、PC再起動

perlで s z t u の順になるのを確認。しかし [a-z] が t u 以降にもマッチするのは変わらなかった。
=> 順番が変わることによるトラブルを避けるために対策されている？

※ これをやると環境の一部がエストニア語で上書きされ日本語に戻せなくなるので
試すなら「VM ware」や「Virtual PC」等の仮想マシンで試しましょう。

2005/9/5 に問題報告がされているのでそれ以前にリリースされたFreeBSDを使って試せば
完全に再現出来る可能性大。そして 4.11で再現出来なくなっていれば対策が取られたということになる。

158: 2014/03/30(日)04:03 ID:???.net AAS
--------c:\test.pl-----------
use locale;
print +(sort grep /[a-z]/i, map { chr } 0..255), "\n";
--------c:\test.pl-----------

C:\>perl test.pl
aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsSzZtTuUvVwWxXyY

C:\>perl -v
This is perl 5, version 16, subversion 3 (v5.16.3) built for MSWin32-x86-multi-thread

-----------------------------------
↓これを使わなくても順番が変わった。
use POSIX qw(setlocale LC_ALL);
setlocale(LC_ALL, "et_EE.ISO8859-1");
コンパネで「エストニア」と指定しただけで「et_EE.ISO8859-1」は未指定の状態。
-----------------------------------
/[a-z]/i を /\w/ に変えると英字以外の文字も英字の間に
挟まっていることが確認出来る。

159: 2014/03/30(日)04:24 ID:???.net AAS
--------c:\test.pl-----------
use locale; # これが無いと順番が変わらない
use POSIX qw(setlocale LC_ALL); # コメントアウトしても変化なし
setlocale(LC_ALL, "et_EE.ISO8859-1"); # コメントアウトしても変化なし

my $abc;
$abc = "STU";
$abc =~ s/[A-Z]/hit/g;
print $abc."\n";
--------c:\test.pl-----------

[結果] hithithit
順番が変わっていれば S にしかマッチしないはずだが3文字すべてに
マッチしている。

LC_ALL を LC_CTYPE や、 LANG などに変えたり、test.plを保存するときの
文字コードをutf-8からshift_jisに変えたりしても結果変わらず。

XPsp3+perl5.16.3の環境で S だけにマッチさせる手段は無いと思われる。

160(1): 2014/03/30(日)05:25 ID:???.net AAS
>>156
「辞書順」はロケールに依存するが「文字コード順」は文字コードに依存する、んじゃね？
文字集合の範囲指定が文字コード順と定義されているなら、
いくらロケール切り替えても文字コード切り替えない限り無意味だろう。

で、文字集合の範囲指定ってどっちだと定義されてるの？

161: 2014/03/30(日)14:02 ID:???.net AAS
>>160
俺はロケールや文字コードの知識はほとんど無いんでよく分かってない。
↓は winXPsp3 + perl5.16.3 + ロケール = 「日本」の環境での実験結果。

・ [ｧ-ｨ]　がｱにマッチするか実験。( 文字コード順ならマッチしないはず )

----------------------------------------
use locale;

if ( "ｱ" =~/[ｧ-ｨ]/ ){ print "hit\n"; }
else { print "no hit\n"; };
----------------------------------------
結果： hit　( マッチしたので文字コード順ではない )

この環境での範囲指定は↓の順みたい。これはshift_jisの並び順とは違う。(これが辞書順？)
----------------------------------------
_0123456789aAbBcCdDeEfFgGhHiIjJkKlLmMnNoOpPqQrRsStTuUvVwWxXyYzZｧｱｨ
ｽｾｿﾀﾁｯﾂﾃﾄﾅﾆﾇﾈﾉﾊﾋﾌﾍﾎﾏﾐﾑﾒﾓｬﾔｭﾕｮﾖﾗﾘﾙﾚﾛﾜｦﾝ
----------------------------------------

文字コードでなくロケールに依存するという発想は思い付かなかったわ、そっちの線で
また実験しながら遊んでみるよ、辞書順とやらも調べてみる。ヒントありがとう。

162: 2014/03/31(月)00:44 ID:???.net AAS
(>>156)
ついに [a-z] が t 以降にマッチしない動作の再現に成功！
et_EE.ISO8859-1 の代わりに et_EE.ISO8859-15 を使ったら再現出来ました！

今まで助言をくれたみなさんありがとう～。自分一人じゃ絶対無理だった。

↓こちらの方々にも感謝～

初心者もOK! FreeBSD質問スレッドその117
2chｽﾚ:unix

詳しい手順はもう少し調べて整理してから載せます。

163: 2014/04/01(火)22:34 ID:???.net AAS
正規表現道場 in ジオシティーズ
外部ﾘﾝｸ:akiba.geocities.jp

とりあえず場所確保。

164: 2014/04/12(土)17:21 ID:???.net AAS
2ch　.scに移転しました。

正規表現道場 Part2
2ch.scｽﾚ:php

■ 2ch.netの問題点

・ 2chscがNGワードになってるので正規表現をスレに貼るのに支障が出る。何より言論統制はイクナイ。
・管理人が今後どう動くか予測が付かない。
　自暴自棄になりIPや書き込み履歴を大公開して逃走する可能性すらある。会社IPの人は注意。

165: 2014/04/12(土)20:53 ID:kZRku0LV.net(1) AAS
もうこっちに帰ってくるなよ

166: 2014/04/13(日)01:40 ID:A85j5pKxi(1) AAS
転載禁止の所を転載している謎技術とか行ってるけど、現にコレって転載だろ。
いろいろまだ抗争？も解決してないし、それが落ち着くまではこっちで様子みるべ。
外部ﾘﾝｸ:otona2ch.net

167(1): 2014/04/13(日)05:58 ID:HM6UoDHVD(1) AAS
[a-z] が t u v w x y にマッチしない件 ( 2014/4/13 )
外部ﾘﾝｸ[html]:akiba.geocities.jp

168: 2014/04/14(月)21:18 ID:I3Hv/OmoJ(1) AAS
うーん、サイト名が長すぎだなぁ。そのうちに検索結果で他と被りにくい名前に変えます。
ページタイトルも「エストニア」は入れるべきだった。

169: 2014/04/15(火)00:52 ID:qzSZ8Z/6K(1/2) AAS
せいきなんとか
外部ﾘﾝｸ:akiba.geocities.jp

ググりやすさ重視の名前にしました。「正規表現」の書きにくさを回避。
検索でも他サイトと被りそうにないし。

170(1): 2014/04/15(火)16:53 ID:ltPJoRVKc(1) AAS
>>167.sc
余談のsedのロケールのバグ、記事にロケール出てこねぇぞと思ったらコメント欄の話か。
しかしこの記事もコメントの指摘もなんか見覚えあるな、と思ったらこの通りすがり俺だったよ。
処理中の文字が延々巻き戻るのは見たときは謎かったなぁ…
文字範囲の決定にもロケール使ってるとは想像もしてなかったわ

171: 2014/04/15(火)20:40 ID:qzSZ8Z/6K(2/2) AAS
>>170
デバック出来るとかすごいね、解析ＧＪ。肝心のバグはもうfixされてるん？

＞文字範囲の決定にもロケール

ロケールの知識が無い俺にはsortと文字範囲で順番が違うperlの仕様の
ほうが謎だった。sortと文字範囲の両方を使うコードでごちゃごちゃになりそう、ってね。

172(1): 2014/04/15(火)20:38 ID:CfZz5H/X.net(1) AAS
Yahoo! Pipesの仕様なんて知らんが
文字列の開始も終わりも指定してないということは
.*/で一番最後の/までが対象として消える可能性はある

173: 2014/04/16(水)10:42 ID:???.net AAS
>>172
ありがとうございます、確かめてみます

174: 2014/04/17(木)01:54 ID:eRhSPtIcZ(1) AAS
ああ、fixもなにも２０１０年で更新止まってるんだね。

sed for Windows
外部ﾘﾝｸ[htm]:gnuwin32.sourceforge.net

175: 2014/04/26(土)23:09 ID:1SAuVtJQy(1) AAS
タグの中に "ある文字列" を含まない正規表現 : せいきなんとか
外部ﾘﾝｸ[html]:akiba.geocities.jp

せいきなんとかでググっても一向にヒットしない件。失敗したか・・。

176: 2014/04/27(日)09:14 ID:WGxc1V+4r(1/4) AAS
あ、そうか　<a href=～>せいきなんとか</a>　みたいにリンクタグで
囲ってないからか・・

177: 2014/04/27(日)13:06 ID:WGxc1V+4r(2/4) AAS
実験に使ったヤフーのHTMLソースの中に

d<a.length;

みたいなjsが２つあるのが発覚。<a\b がこれに誤爆するから
実験結果に大幅な狂いが出ている可能性大。

論文の撤回するなら今でしょ。

178: 2014/04/27(日)18:24 ID:WGxc1V+4r(3/4) AAS
jsの中に　<a href="～"> ～ <\/a>　も発見。だめだこりゃ。

179(2): 2014/04/27(日)22:09 ID:WGxc1V+4r(4/4) AAS
差分
外部ﾘﾝｸ[html]:akiba.geocities.jp

１、\s を \b に書き換えると２～３倍遅くなる　→　jsへの誤爆による間違い

２、/xsigaa を /xsg にすると 0.370 秒
　　 → i を消したことで小文字の "xyz" にマッチしなくなる、致命的ミス。

３、最適化の影響が強烈に　→　間違いを根拠にした思い込みだった。

180: 2014/04/29(火)19:15 ID:6kcXgg+78(1/4) AAS
いちいち　 　を付けるのが面倒だから <pre> ～ </pre>　で手抜きしたら
コピペした時に改行が反映されずに１行に繋がった文字列がクリップボードに入ってた。

てことで　 　を使ってアップし直しました。

クリップボードを置換するアプリで実態参照の置換と一緒にやれば楽そう。
--------
そういえばココって連投規制あるのかな・・

181: 2014/04/29(火)19:21 ID:6kcXgg+78(2/4) AAS
>>179 は pre のままなので試したい人は↓の部分を選択してコピペしてみてね。
divをまたいで選択すると１行に繋がった。( win + firefox )

--------------
＜１＞　先読みを使ったシンプルなもの
m/
<a\s[^>]*>
(?:
--------------

182: 2014/04/29(火)19:57 ID:6kcXgg+78(3/4) AAS
$TestString = "置換したいテキスト";

# 以外の置換をしないなら (0) にする。
if (1){
$TestString =~ s/ & /&/xg;
$TestString =~ s/ < /</xg;
$TestString =~ s/ > />/xg;
$TestString =~ s/ \" /"/xg;
$TestString =~ s/ \' /'/xg;
}
$TestString =~ s/ \n / \n/xg;

183: 2014/04/29(火)20:00 ID:6kcXgg+78(4/4) AAS
↑失敗。

$TestString = "置換したいテキスト";

# 以外の置換をしないなら (0) にする。
if (1){
$TestString =~ s/ & /&/xg;
$TestString =~ s/ < /</xg;
$TestString =~ s/ > />/xg;
$TestString =~ s/ \" /"/xg;
$TestString =~ s/ \' /'/xg;
}
$TestString =~ s/ \n / \n/xg;

184: 2014/04/30(水)01:17 ID:cy+DeXB/r(1) AAS
Perl 5.14 から使える正規表現のオプション : せいきなんとか
外部ﾘﾝｸ[html]:akiba.geocities.jp

185: 2014/05/01(木)20:25 ID:UfiPBLyV5(1) AAS
(>>179)
＞１、\s を \b に書き換えると２～３倍遅くなる　→　jsへの誤爆による間違い

後ろをみないマッチで書くことよりこういう対策のほうがよっぽど大事だな・・。
閉じタグが無い場合にどこかで走査を打ち切るような書き方をするべきか。

186(1): 2014/05/02(金)13:26 ID:Y6W0G4b1J(1) AAS
(試作) 文字数制限

my $cnt = 0; my $str = ""; my $res = "";
for ( my $i=0; $i<100 ; $i++ ){
$str = '<a href="./">' . "e" x $i . '</a>';
if ( $str =~ m/
<a\s[^>]++>
(?{ $cnt = pos($str); })
(?:
 (?:
 [^<]
 |(?!<\/?+a\b).
 ){1,5}
 (?(?{ 30 < pos($str)-$cnt; })(*SKIP)(*PRUNE)(*F))
)*+
<\/a>
/xsgiaa
){ $res .= "$i,"; } # if
} # for
print "$res\n";

187: 2014/05/03(土)13:19 ID:DYMsAnw3D(1/3) AAS
↑

my $cnt = 0; my $TestString = ""; my $res = ""; my $err="";
for ( my $i=0; $i<50 ; $i++ ){
$TestString = '<a href="./">' . "e" x $i . '</a>';
if ( $TestString =~ m/
<a\s[^>]++>

(?:
 [^<]
|
 (?!<\/?+a\b).
){0,30}+

(?:
 <\/a>
|
 (?{ $err .= pos($TestString) . ","; })
 (*SKIP) (*PRUNE) (*F)
)

/xsiaa
){ $res .= "$i,"; } # if
} # for
print "$res\n";
if ($err){ print "<\/a> 404 => $err\n"; }

188: 2014/05/03(土)13:21 ID:DYMsAnw3D(2/3) AAS
(>>186) /g 不要。

189: 2014/05/03(土)13:51 ID:DYMsAnw3D(3/3) AAS
連投規制？

190: 2014/05/05(月)18:07 ID:eelRtXApD(1/2) AAS
線形代数を学ぼう
外部ﾘﾝｸ:yonex1.cis.ibaraki.ac.jp

高等学校数学C 行列
外部ﾘﾝｸ:ja.wikibooks.org

行列の積
外部ﾘﾝｸ[html]:www.geisya.or.jp

行列のできる法律相談所
外部ﾘﾝｸ:www.ntv.co.jp

191: 2014/05/05(月)21:14 ID:eelRtXApD(2/2) AAS
行列の計算
外部ﾘﾝｸ[html]:www2u.biglobe.ne.jp

どわすれ Perl メモ
外部ﾘﾝｸ[html]:www001.upp.so-net.ne.jp

perldoc.jp : 配列の配列の定義とアクセス
外部ﾘﾝｸ[pod]:perldoc.jp

192: 2014/05/08(木)02:37 ID:???.net AAS
ファイル検索ツールでパスを入力する時、「\」「/」を入れると候補が0になってしまいます
d:\\abc\\123\\ のように入力しているのですが、間違っていますか？

193: 2014/05/08(木)03:20 ID:Zyar7s4i.net(1) AAS
そのファイル検索ツールのところで聞けばー

194: 2014/05/10(土)19:05 ID:28mBAE6hX(1/3) AAS
Regexp-Assemble : 正規表現の最適化モジュール
外部ﾘﾝｸ:search.cpan.org

195(1): 2014/05/10(土)23:53 ID:28mBAE6hX(2/3) AAS
変態的正規表現モジュールを支える Regexp::Assemble::Compressed
外部ﾘﾝｸ:perl-users.jp

＞「ばよえ～ん警報発令!?」でお馴染みの

ｗｗ

196: 2014/05/10(土)23:56 ID:28mBAE6hX(3/3) AAS
404 Blog Not Found : perl - Regexp::Assembleのススメ
外部ﾘﾝｸ[html]:blog.livedoor.jp

197(1): 2014/05/11(日)00:22 ID:tZLC/oS6w(1/6) AAS
(>>195)
＞ (?-xism:[1-9a-zな-の])

ロケールによってはこれは・・

198: 2014/05/11(日)10:37 ID:tZLC/oS6w(2/6) AAS
(>>197)
あ、perlでは範囲指定は影響しない(?)んだった。

199: 2014/05/11(日)20:44 ID:tZLC/oS6w(3/6) AAS
Regexp::Assemble のインストール

もばぎつかいの新ぶろぐ » 正規表現生成モジュールってあるんだ・・・
外部ﾘﾝｸ:mobagitukai.xrea.jp

200(1): 2014/05/11(日)21:05 ID:tZLC/oS6w(4/6) AAS
ubuntu で cpan

Ubuntu日本語フォーラム
Ubuntu 上で perl モジュールはどのようにしてインストールなさっているでしょうか？
外部ﾘﾝｸ[php]:forums.ubuntulinux.jp

201: 2014/05/11(日)22:07 ID:tZLC/oS6w(5/6) AAS
use Regexp::Assemble::Compressed;
my $rac = Regexp::Assemble::Compressed->new;
for my $char (1 .. 9, 'a' .. 'z', qw(ぁあいぃうぅ)) {
$rac->add($char);
}

[結果]
(?^u:[1-9a-zぁ-う])

/u が付いてきた。よく出来てるなぁ。

202: 2014/05/11(日)22:28 ID:tZLC/oS6w(6/6) AAS
( '[a]', '[b]', '[cd]', 'e')　=>　(?^:(?:[abe]|[cd]))
( 'a', 'b', '\cd', 'e')　=>　(?^:[\cDabe])
( '\x61', 'b', '[cd]', 'e')　=>　(?^:(?:[abe]|[cd]))

( '\c)', 'a')　=>　(?^:[\c)a])
( '(\c))', 'a')　=>　(?^:(?:(\c))|a))

203: 2014/05/12(月)17:23 ID:ETxOhGhXB(1/2) AAS
タライ
外部ﾘﾝｸ:en.wikipedia.org

204: 2014/05/12(月)20:58 ID:ETxOhGhXB(2/2) AAS
perldoc.jp : Benchmark - Perl コードの実行時間のベンチマークを行なう
外部ﾘﾝｸ[pod]:perldoc.jp

＞ use Benchmark qw/:all/;

＞この表は遅いものから早いものの順にソートされ、それぞれのテスト間の
＞速度の差を百分率で表示します。

＞空ループのシステム時間は、実際のコードを含むループのシステム時間よりも
＞多少多くかかることがある

205: 2014/05/13(火)13:17 ID:StO5KeEw5(1/7) AAS
(>>200)
ubuntu13.10日本語Remix版にはデフォでRegexp::Assembleが入ってる？
何もしてないのに使えた。

206: 2014/05/13(火)13:23 ID:StO5KeEw5(2/7) AAS
Regexp::Assemble - ubuntu13.10日本語Remix版でのパス
/usr/share/perl5/Regexp/Assemble.pm
バージョンは0.35

207: 2014/05/13(火)13:30 ID:StO5KeEw5(3/7) AAS
print "\cあ";　←エラー表示でAssemble.pmのパスが分かる。

208: 2014/05/13(火)14:03 ID:StO5KeEw5(4/7) AAS
↑嘘
-----------------------------------
#!/usr/bin/perl
use Regexp::Assemble;
my $ra = Regexp::Assemble->new;
$ra->add( '\cあ' );
print $ra->re;
-----------------------------------

209: 2014/05/13(火)14:06 ID:StO5KeEw5(5/7) AAS
win - perl5.16.3
-----------------------------------
Character following "\c" must be ASCII at C:/Perl/site/lib/Regexp/Assemble.pm li
ne 1003.
-----------------------------------

210: 2014/05/13(火)19:16 ID:StO5KeEw5(6/7) AAS
ペールで文字コード変換

404 Blog Not Found : perl - Encode 入門
外部ﾘﾝｸ[html]:blog.livedoor.jp

211: 2014/05/13(火)20:02 ID:StO5KeEw5(7/7) AAS
はてな: 404 Blog Not Found 「Perlの文字コードの記事のまとめ」
外部ﾘﾝｸ:d.hatena.ne.jp

ホリエモンにぶっこ抜かれた人らしい

212(1): 2014/05/14(水)01:23 ID:HC0rJwFJ3(1/3) AAS
404 Blog Not Found： regexp - で Apache Combined Log を Parse する
外部ﾘﾝｸ[html]:blog.livedoor.jp

＞qr/\"((?:\\[\\\"]|.)*?)\"/
『"\"』に誤爆する。けどデータ上は大丈夫なのか。これはよっぽど
自信がないと書けない書き方だ。

Ｑ１、強欲を使わないのは何故か。
*?のほうが早いから？使っても変わらないから？それとも互換性の問題？

Ｑ２、ループ展開のようなことは出来ないのか否か。直感的にはピリオドで
1文字ずつの繰り返しでマッチさせてるので相当遅いイメージ・・
しかもピリオドがあるのは分岐の後半。

上下前次 1-新書関写板覧索設栞歴

あと 254 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.028s