[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
969: 2023/11/28(火)16:21 ID:vIU65Zk5(3/5) AAS
$ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]
$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]
後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
970: 2023/11/28(火)16:22 ID:vIU65Zk5(4/5) AAS
Rubyのコードも持ってきた。持ってきただけだから意味は知らん。
ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]
ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
971(1): 2023/11/28(火)16:44 ID:wVUnEJO+(1) AAS
ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ
972(1): 2023/11/28(火)16:47 ID:uy7CvN4q(3/3) AAS
>>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは
どの正規表現環境でも同じだと思うよ
973: 2023/11/28(火)16:49 ID:CppHkuHl(1) AAS
0文字と一致させたくなければ.*ではなく.+と書けよ
974: 2023/11/28(火)16:59 ID:fB6/42vV(1/2) AAS
>>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ
個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
975: 2023/11/28(火)17:02 ID:fB6/42vV(2/2) AAS
/(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど
976: 2023/11/28(火)17:09 ID:vIU65Zk5(5/5) AAS
>>971
探したけど見つからんかった。
どこにあった? or どうやって探した?
キーワードがわからん
977: 2023/11/28(火)18:08 ID:waKUlTL5(1) AAS
これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
978: 2023/11/28(火)18:30 ID:mMoqXMUf(1) AAS
(ハクション!
979: 2023/11/28(火)19:16 ID:6l9rHssS(1) AAS
単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん
980(2): 2023/11/29(水)13:08 ID:yvH2v9xT(1/2) AAS
正規表現検索は失敗しないかぎり終わらないって話では
abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
981: 2023/11/29(水)14:41 ID:lw8jVmFR(1/3) AAS
そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
982: 2023/11/29(水)17:53 ID:AoutXZD6(1) AAS
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき
1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
983: 2023/11/29(水)18:01 ID:lw8jVmFR(2/3) AAS
確かにその通りやな、1度目で消費しきっとるはずや
984: 2023/11/29(水)18:06 ID:lw8jVmFR(3/3) AAS
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
985(1): 2023/11/29(水)20:04 ID:x7bR/xfi(1) AAS
/(.*)$(.*)$((.*)$){999}/
986: 2023/11/29(水)22:25 ID:yvH2v9xT(2/2) AAS
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?
2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
987: 2023/12/01(金)02:37 ID:07OBAnmr(1) AAS
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?
$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]
$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
988(1): 2023/12/01(金)08:09 ID:RWimeGTM(1) AAS
/^\w+|$/[$&]/
これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
989: 2023/12/02(土)00:36 ID:/f7jnFb0(1) AAS
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
外部リンク[html]:tc39.es
・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
ただし空文字にマッチした場合、先へ進まなくなることを回避するために
次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
990: 2023/12/07(木)23:24 ID:Ug9Hn2aN(1/2) AAS
KEEPのKはあるのにPが無い、何故?
991: 2023/12/07(木)23:31 ID:Ug9Hn2aN(2/2) AAS
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
992: 2023/12/10(日)09:57 ID:8JqB6SG/(1) AAS
>>988
思うよ
+の後に$を置けば余計にそう思う
993: 2023/12/10(日)13:04 ID:t3u5G9tC(1) AAS
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
994: 2023/12/10(日)14:15 ID:ayXeZXuA(1) AAS
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
995: 2023/12/10(日)15:43 ID:e6Tz3fj/(1/2) AAS
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる
$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
996: 2023/12/10(日)15:44 ID:e6Tz3fj/(2/2) AAS
s/バク/バグ/
997: 2023/12/13(水)11:48 ID:wzNHEkEB(1) AAS
ただの仕様だよ、あほらし
次スレよろ
998(1): 2023/12/16(土)09:00 ID:KMxF6SWS(1) AAS
次スレ
2chスレ:tech
上下前次1-新書関写板覧索設栞歴
あと 4 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.026s