[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
1
(4): 2021/11/03(水)19:50 ID:ebAE+z9+(1/4) AAS
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part15
2chスレ:tech

次スレは>>980宜しく
天ぷら等>>2以降
876: 2023/09/13(水)21:32 ID:qhl2oEPa(3/3) AAS
>>874-875
ありがとうございます。875さんの方でプログラムがパーフェクトに動くものが叶いました。
877: 2023/09/14(木)00:22 ID:L47o5ku7(1) AAS
鬼車は結局Unicode15対応版がリリースされなかったな
878: 2023/09/16(土)22:56 ID:dIGSEJlt(1) AAS
同じワードの繰り返し(回数指定)を除外する正規表現を教えてください
879: 2023/09/17(日)07:04 ID:jNYPDoV+(1/2) AAS
除外??
880: 2023/09/17(日)10:23 ID:ht+84nM7(1) AAS
こういうこと?
abcxyzacz → bxy
881: 2023/09/17(日)14:29 ID:yn1jo0MJ(1/3) AAS
"にゃんたま"が3回以上登場する文字列から全ての"にゃんたま"を取り除く

\A(?=(?:(?:(?!にゃんたま)[\s\S])*にゃんたま){3})((?:(?!にゃんたま)[\s\S])*)にゃんたま|\G((?:(?!にゃんたま)[\s\S])*)にゃんたま
882: 2023/09/17(日)14:33 ID:yn1jo0MJ(2/3) AAS
置換後の文字列: $1$2
883: 2023/09/17(日)15:23 ID:yn1jo0MJ(3/3) AAS
スマン、\Gの前に(?!\A)を置いてくれ
884: 2023/09/17(日)16:53 ID:oNTID2ix(1) AAS
3回連続して出現する単語を削除
//javascript
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎';
console.log(s.replace(/(?:(.+)\1{2})/g, ''));

#python
s = '鼠牛虎兎龍蛇ねこねこねこ牛牛牛虎虎蛇蛇蛇蛇蛇龍龍兎'
print(re.sub(r'(?:(.+)\1{2})', '', s))
885: 2023/09/17(日)17:05 ID:Fm9hMrUa(1) AAS
\nを30回以上は非表示するにはどうしたらいいですか
886: 2023/09/17(日)17:18 ID:jNYPDoV+(2/2) AAS
非表示??
887: 2023/09/17(日)17:41 ID:PjfamyxI(1) AAS
\nがn回以上除外で
888: 2023/09/17(日)22:51 ID:jyrM2LRG(1) AAS
●Regular Expressionの使用環境
Perl

●検索か置換か?
検索

●説明
後ろから2つ目の/以降を取得したい

●対象データ
/a/bb/ccc/dddd/eeeee/cgi/sample.cgi

●希望する結果
/cgi/sample.cgi

お願いします
889: 2023/09/18(月)01:07 ID:e1xt8o+y(1) AAS
.*\K/.*/.*
890: 2023/09/23(土)15:35 ID:UU1JiicL(1) AAS
何回連続とか何番目とかってのは正規表現じゃなくて言語でなんとかした方がいいのでは
可読性的な観点からでも
891: 2023/09/25(月)14:32 ID:w/fMdm7Q(1) AAS
正規表現じゃなく言語表現をなんとかした方がいい
892: 2023/09/25(月)15:45 ID:b6Bm13IE(1/2) AAS
正規表現じゃなく性器表現とした方がいい
893: 2023/09/25(月)15:46 ID:b6Bm13IE(2/2) AAS
正規表現じゃなく性器表現とかなんとかにした方がいい
894
(1): 2023/09/26(火)17:43 ID:WhLFttTP(1) AAS
添削って受け付けてたっけ?
自分が求める結果は得られてるけど、それでいいのかどうか
895: 2023/10/03(火)15:05 ID:pjWozC8L(1) AAS
>>894
You ここで見せちゃいなよ、meが見てあげるよ
896: 2023/10/15(日)05:59 ID:qeiyy+lM(1/3) AAS
oniguruma Release 6.9.9

Update Unicode version 15.1.0
NEW API: ONIG_OPTION_MATCH_WHOLE_STRING
Fixed: (?I) option was not enabled for character classes (Issue #264).
Changed specification to check for incorrect POSIX bracket (Issue #253).
Changed [[:punct:]] in Unicode encodings to be compatible with POSIX definition. (Issue #268)
Fixed: ONIG_OPTION_FIND_LONGEST behavior

> ONIG_OPTION_MATCH_WHOLE_STRING マッチした終端の位置がendになることを要求

マッチした開始の位置はstartでなくても良いらしい

oniguruma/test/test_options.c
x2(ONIG_OPTION_MATCH_WHOLE_STRING, "a", "aaaa", 3, 4); // OK (4文字目のaにマッチ)

> [[:punct:]]

Changed the definition of [:punct:] in Unicode encodings from \p{P} to \p{PosixPunct} = \p{P} + \p{S}.
(PosixPunct is a new addition.)
897: 2023/10/15(日)06:13 ID:qeiyy+lM(2/3) AAS
> Fixed: ONIG_OPTION_FIND_LONGEST behavior

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "ab", 0, 2); // OK ( "ab" にマッチ)

最左最長一致からガチ最長一致になってる
898: 2023/10/15(日)06:27 ID:qeiyy+lM(3/3) AAS
間違えた、こっちだった

oniguruma/test/test_options.c
x2(ONIG_OPTION_FIND_LONGEST, "a(b|bc)", "abc", 0, 3); // OK ( "abc" にマッチ)

// マルチバイト文字には非対応のまま
x2(ONIG_OPTION_FIND_LONGEST, "ab|あ", "abあ", 2, 5); // OK ( "あ" にマッチ)

UTF-32 にエンコードしてから使えばいいのかしら
899
(1): 2023/10/20(金)08:36 ID:S3IcPVBq(1) AAS
Strawberry Perl
外部リンク[html]:strawberryperl.com

32bit版が出なくなった。64bitに乗り換えよう。(全銀)
900: 2023/10/20(金)16:11 ID:8kCGh912(1) AAS
>>899
ZIP edition が無い…
901: 2023/10/21(土)14:33 ID:43n7K7Fq(1) AAS
tar.gzで我慢しなさい
902: 2023/10/29(日)10:19 ID:zDgIETfO(1/4) AAS
アルファベットのみにマッチする文字クラスを[a-Z]と書けない
ASCIIコード表を決めた人達は今頃失敗したと思ってるんだろうか
903: 2023/10/29(日)12:34 ID:vOjtdftv(1) AAS
初心者向けクイズ
Q: /w にマッチするアルファベット以外の文字がひとつあります。その文字とは、一体何でしょうか?
904: 2023/10/29(日)12:42 ID:BaFdPLsN(1) AAS
アンダースコート
905: 2023/10/29(日)12:45 ID:zDgIETfO(2/4) AAS
アンダースロー
906: 2023/10/29(日)13:20 ID:y5KdwCim(1) AAS
アンダーニンジャ
907: 2023/10/29(日)15:41 ID:zDgIETfO(3/4) AAS
ニンジャリバンバン
908: 2023/10/29(日)19:20 ID:dO2GnsiA(1) AAS
正解はスラッシュでした
909: 2023/10/29(日)19:49 ID:zDgIETfO(4/4) AAS
(/w\)
910
(1): 2023/10/30(月)20:06 ID:wzEyUd/K(1) AAS
ASCIIコード表について調べてみたら特定の1ビットを0にするか1にするかで
大文字小文字が変換出来るようにするための順番らしい
並びの便利さより処理効率が優先されてた、先人の知恵に敬礼
911: 2023/10/30(月)20:59 ID:dhg2pdyL(1) AAS
どうせ範囲チェックはしないといけないんだから
それだったら引き算や足し算で大文字小文字変換できちゃう
まあ昔はbit演算より算術演算にステップ数が掛かってたからその当時は良かったんだろうけど
912: 2023/10/31(火)18:36 ID:X00tNW2d(1) AAS
今時のマシンのことしか考えなくていいなら足し引きで良さそうだけど
遅いマシンのことまで考えるならビット演算一択になるんだろうな

アルファベットが32文字だったら隙間出来なかったのに
SHIFT_JISのダメ文字問題も最初からEUC-JPにしとけば苦労しなかったのにな
913: 2023/10/31(火)21:57 ID:27STA2Pg(1) AAS
正規表現は改行の扱いが難しいなあ
やらかすときはたいてい改行の処理でミスる
914: 2023/11/01(水)09:19 ID:DBguvWIQ(1/3) AAS
. が改行にマッチしないのを失念してってのは何度もやってる
915: 2023/11/01(水)11:38 ID:ikHnu6pN(1/3) AAS
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ
916
(2): 2023/11/01(水)11:38 ID:ikHnu6pN(2/3) AAS
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)

●検索か置換か?
検索

●説明
キムラタクヤの略称を検索するために
(キムラ)と(タクヤ)からそれぞれ1字以上使って並べた単語にマッチする正規表現を作りました
^(キ|ム|ラ|キム|ムラ|キラ|キムラ)(タ|ク|ヤ|タク|クヤ|タヤ|タクヤ)$
文字数や単語数が増えたときひどいのでもっと上手な書き方を教えてください

●マッチする文字列
キク
キラク
ムラタヤ

●マッチさせない文字列
キム
キムラ
タクヤ
917
(1): 2023/11/01(水)12:08 ID:oh2mJ3WA(1) AAS
^(?:キ?ム?ラ?)(?<=\S)(?=\S)(?:タ?ク?ヤ?)$
918: 2023/11/01(水)14:40 ID:DBguvWIQ(2/3) AAS
同じ人かは分からないけど超優秀な回答者がここ1,2年前から来てくれてる
多くの閲覧者にとっても勉強になるからありたがいことです
919: 2023/11/01(水)16:00 ID:G1jsC9Xy(1) AAS
じつはその人AIだよ
920
(1): 2023/11/01(水)17:01 ID:ikHnu6pN(3/3) AAS
>>917
ありがとうございます動きました
3語以上の場合はこれでできてますか?
^(?:キ?ム?)(?<=\S)(?=\S{2})((?:ラ?タ?)(?<=\S{2})(?=\S)(?:ク?ヤ?))$
921: 2023/11/01(水)17:03 ID:DBguvWIQ(3/3) AAS
AIと言われても違和感が無いから困る、人間だったほうがいい

サクラエディタを少し触ってみたが
\r を \c-
\n を \c*
に書き換えてもマッチした

このことは恐らくbregoing.dllの作者氏でも知らないのでは
922: 2023/11/01(水)18:26 ID:upaRAmPk(1) AAS
>>920
キムクヤにマッチするから駄目だね
>>916のように自分で組み合わせを展開する以外の方法はわからないね
923: 2023/11/01(水)21:03 ID:bvA/YDb8(1) AAS
最後で語数チェックすれば?
(?<=\S{3})$
924
(1): 2023/11/01(水)22:35 ID:8ROMQdip(1) AAS
^(キ?ム?ラ?)(タ?ク?ヤ?)$(?!\1|\2)

^(キ?ム?)(ラ?タ?)(ク?ヤ?)$(?!\1)(?!\2)(?!\3)
^(キ?ム?)(?!.*+$\k<-1>)(ラ?タ?)(?!.*+$\k<-1>)(ク?ヤ?)(?!.*+$\k<-1>)$
^(?=(.++))(?:キ?ム?)(?!\k<-1>)(?=(.++))(?:ラ?タ?)(?!\k<-1>)(?=(.++))(?:ク?ヤ?)(?!\k<-1>)$
925: 2023/11/02(木)08:03 ID:ztJD977Y(1) AAS
文字数も単語数も拡張性もばっちりです
ご指導ありがとうございました
926: 2023/11/02(木)09:18 ID:/CeYlFrx(1/2) AAS
> $(?!\1|\2)
これもすごい、こんなの思い付かない
私なら(?(1))を使おうとしてグチャる
こういうのを作れる人になりたかった、羨ましい限りだ
927: 2023/11/02(木)09:22 ID:kxWwWLf8(1) AAS
>>910
アルファベットが32文字だったら誰も困らなかったはず
928: 2023/11/02(木)11:56 ID:YMFW9tw8(1) AAS
各文字列から最低2文字以上含まれてる略称にだけマッチすることもできる?
929: 2023/11/02(木)13:01 ID:eLjTHeK1(1) AAS
^(?=.(.++))(?:キ?ム?ラ?)(?!.?\k<-1>)(?=.(.++))(?:タ?ク?ヤ?)(?!.?\k<-1>)$
^(?=.{1}(.++))(?:キ?ム?ラ?)(?!.{0,1}\k<-1>)(?=.{1}(.++))(?:タ?ク?ヤ?)(?!.{0,1}\k<-1>)$
930: 2023/11/02(木)19:36 ID:/CeYlFrx(2/2) AAS
ラノベ 「1日でキムタクの一般項が出来てるからパソコンそっと閉じて見なかったことにする」
931: 2023/11/03(金)08:34 ID:cY7DSC5H(1/2) AAS
^[キムラ]{1,2}[タクヤ]{1,2}$
932: 2023/11/03(金)09:08 ID:PqFUo1lf(1/5) AAS
それはラキクタにマッチするからボツ(==.)
933: 2023/11/03(金)10:43 ID:cY7DSC5H(2/2) AAS
ラキクタにマッチしたらダメって条件にはないんだけど‥
934: 2023/11/03(金)11:44 ID:PqFUo1lf(2/5) AAS
確かに言葉ではそんな条件は書いてないね、曖昧3cm
935: 2023/11/03(金)11:50 ID:zxzLPr4V(1) AAS
^?キ?ム?ラ?タ?クヤ?$が略称条件な流れ?
936: 2023/11/03(金)12:14 ID:sAJhyk0D(1) AAS
^(?=A)(?=B).*$
937
(1): 2023/11/03(金)12:18 ID:PqFUo1lf(3/5) AAS
>>916を読めば文字順通りと受け取るのが妥当だね

ちなみにもしこのコマンドがあったら簡単に書けた
外部リンク[html]:www.proxomitron.info

^(キ?ム?ラ?)$TST(\1=..+)(タ?ク?ヤ?)$TST(\2=..+)$

perlなら(??{code})でこのコマンドと同じことが出来るけどサクラエディタのdllでは無理
dllに$SETと$TSTが実装されたら正規表現の幅がめっちゃ広がるけど無理そう

// \1 に日本語表記での色が代入される
blue$SET(1=青)|yellow$SET(1=黄)|red$SET(1=赤)
938: 2023/11/03(金)13:00 ID:RnAsJxc7(1) AAS
>>924
^(?=(キ?ム?ラ?)(タ?ク?ヤ?)$)[キムラ]{1,}[タクヤ]{1,}$

(?=(キ?ム?ラ?)(タ?ク?ヤ?)(.*+))[キムラ]{1,}[タクヤ]{1,}(?=\3)
キキムタククク
939: 2023/11/03(金)18:04 ID:328LomOy(1) AAS
キムラタクヤ人気で🌿
940: 2023/11/03(金)19:14 ID:3J2AA+3k(1) AAS
>>937
他人には厳しい条件はたすくせに外部コマンドやperl使うのはokなのかw
941: 2023/11/03(金)20:09 ID:PqFUo1lf(4/5) AAS
知ってる外部コマンドは使っていいに決まってる
頭の中では質問見た瞬間に出来てたよ
942: 2023/11/03(金)20:13 ID:/gQFYHMn(1) AAS
「課す」を「はたす」って読んでるってマ?🤣
943: 2023/11/03(金)21:12 ID:PqFUo1lf(5/5) AAS
この外部コマンドを考えた方は2004年に亡くなっている
外部リンク:en.wikipedia.org

20年前にこのコマンドを実装済みだったのはやばいな
perlの正規表現ですらそんなに機能が無かった時代だ
944: 2023/11/03(金)21:17 ID:N1OKG/2k(1) AAS
最初から略称と言ってるのに文字順不問だと思うほうがどうかしてる
945: 2023/11/04(土)08:36 ID:w1sIftMp(1) AAS
(正直|ぶっちゃけぇ?)高度すぎて理解が追いつかない
946: 2023/11/04(土)11:16 ID:PZuBSK2Q(1/2) AAS
カラクリを簡単に説明しよう

1、 (?:キ?ム?ラ?) で文字順を固定
2、 その他の部分でカッコ内でマッチする文字数の制限をかけている

例、 (?:キ?ム?ラ?) が0文字にマッチしたとしよう

\1が捕獲した中身は0文字になる
(?!\1) の\1の中身が0文字だったら (?!\1) は (?!) と同じ動作になる
(?!) は常にマッチを失敗させるから\1が0文字ならマッチ出来ない
結果的にこれが文字数制限になっている

ちなみに正規表現にカウント機能があればもっと簡単に書けていた
(
 (?:キ$COUNT(x))?
 (?:ム$COUNT(x))?
 (?:ラ$COUNT(x))?
)
$COUNT(0<x)

perlは(?{code})でカウント可能、鬼車もカウント機能を実装済
947: 2023/11/04(土)14:47 ID:Xn6+uSVd(1) AAS
perlジジイこのスレでも自演してんのかw
948: 2023/11/04(土)17:37 ID:PZuBSK2Q(2/2) AAS
COBOLジジイからperlジジイにランクアップ
949
(1): 2023/11/05(日)13:03 ID:q8heJbgz(1/3) AAS
サクラエディタ

// 1
\1(a)

// 2
\k<name>(?<name>a)

2は1を名前付き括弧にしただけ
1は実行してもマッチに失敗するだけだが2はエラー
これはどちらもエラーになるほうが良い
950: 2023/11/05(日)13:07 ID:q8heJbgz(2/3) AAS
ん?本当にそうか?分からん
951: 2023/11/05(日)15:52 ID:q8heJbgz(3/3) AAS
2がエラーになるのは誤りだ、異論ある?
いつもの超優秀な人(AI?)の意見を聞かせて欲しい
952: 2023/11/06(月)06:59 ID:j6L5l5bH(1/2) AAS
異論はないってことで良いかな、おそらく既知の問題(仕様)だと思われる
この問題に長年気付かないとは考えられないから

本来動くべきサンプルを貼って>>949の件は終了とする

x2("(?:\\k<n>b|(?<n>a))+", "aab", 0, 3); // ERROR: undefined name <n> reference
x2("(?:(?<n>a)|\\k<n>b)+", "aab", 0, 2); // OK

x2("(?:\\1b|(a))+", "aab", 0, 3); // OK
x2("(?:(a)|\\1b)+", "aab", 0, 2); // OK
953: 2023/11/06(月)19:00 ID:j6L5l5bH(2/2) AAS
回避策
x2("(?<n>a){0}(?:\\k<n>b|\\g<n>)+", "aab", 0, 3); // OK
954: 2023/11/15(水)17:50 ID:Karf8A+O(1) AAS
文字列の頭に部分一致するパターンなんですが・・・

「abcdefg」にマッチするパターンですが、
/^a(?:b(?:c(?:d(?:e(?:f(?:g)?)?)?)?)?)?/
と書くしかないですか?
文字列が長大な場合、ちょっと無理なんですが・・・
(文字はアルファベットとは限らず)
WindowsのJScriptですが。
955: 2023/11/15(水)18:12 ID:ctqB5947(1) AAS
/^abcdefg/
956: 2023/11/15(水)18:41 ID:/mJ+eeiZ(1) AAS
無いんじゃないか?
^(?:abcdefg|abcdef|abcde|abcde|abcd|abc|ab|a)
とどっちがマシかな
957
(1): 2023/11/16(木)14:47 ID:7i/8qZTv(1/2) AAS
/^m/ にマッチして map だけマッチして欲しくない
/^m[^a][^p]/ これだと man にマッチしてくれない
どう書けばいいですか
958: 2023/11/16(木)14:53 ID:4tHpE5Jq(1) AAS
>>957
否定先読みが使えるなら^m(?!ap)かな?
959: 2023/11/16(木)15:59 ID:7i/8qZTv(2/2) AAS
ありがとう
960: 2023/11/17(金)04:25 ID:gwXFy+9L(1) AAS
特定の文字列を検出したい場合、\Q~\Eの~に、その特定の文字列を入れておけば、どんな文字が来ても大丈夫でしょうか?
961: 2023/11/17(金)06:13 ID:28WV0iMa(1) AAS
\Eが来ると困る
962: 2023/11/28(火)12:33 ID:vIU65Zk5(1/5) AAS
正規表現スレがいいと聞いてきました
ここがいい正規表現すれですか?

$ perl -e '$a="abc"; $a =~ s/(.*)/[$1]/g; print $a . "\n"'
[abc][]

なんで後ろにカッコが来るん?
.*に全部マッチするんだから
二個目の[]が来るなんてお菓子にゃん?
963
(1): 2023/11/28(火)13:42 ID:EkqG9ePT(1) AAS
perlよく知らんがgとったら消える
964
(1): 2023/11/28(火)13:54 ID:uy7CvN4q(1/3) AAS
推測だが、
1) .*にabcがマッチする -> [abc]
2) .*は0個でもいいので、末尾位置(NUL)にマッチする -> []
965
(1): 2023/11/28(火)14:25 ID:uy7CvN4q(2/3) AAS
2回目は$a=""の場合と同じだと思えばいい
ヌル文字列でも.*だとマッチするでしょ?
966: 2023/11/28(火)16:18 ID:vIU65Zk5(2/5) AAS
>>963
gとったら消える。Rubyも同じらしい。

>>964
[]が出るってことはなにかにマッチしてるってことでしょ?

>>965
それなら最初の.*にもマッチするじゃん?
一回目にマッチしなくて、二回目にマッチする理由がわからんのよ
967: 2023/11/28(火)16:18 ID:JJPCdnVt(1/2) AAS
仮に2回目でマッチする何かがあったとしても
.*はgreedyなんだから1回目で消費してないとお菓子イイ
968
(1): 2023/11/28(火)16:20 ID:JJPCdnVt(2/2) AAS
でもなぁ
バグなら今までこんなん気が付かないはずないと思うからどうなんだろ
969: 2023/11/28(火)16:21 ID:vIU65Zk5(3/5) AAS
$ perl -e '$a="abc"; $a =~ s/(.*)$/[$1]/g; print $a . "\n"'
[abc][]

$ perl -e '$a="abc"; $a =~ s/(.*$)/[$1]/g; print $a . "\n"'
[abc][]

後ろに$入れても同じ
行末以降の何にマッチしてんのこれ?
970: 2023/11/28(火)16:22 ID:vIU65Zk5(4/5) AAS
Rubyのコードも持ってきた。持ってきただけだから意味は知らん。

ruby -e 're=/(.*)/; puts %Q(abc).sub(re){ %Q([#$1]) }'
[abc]

ruby -e 're=/(.*)/; puts %Q(abc).gsub(re){ %Q([#$1]) }'
[abc][]
971
(1): 2023/11/28(火)16:44 ID:wVUnEJO+(1) AAS
ググってみたがperlのそういう”仕様”として定着してるみたいだな
引っかかったことなかったわ
972
(1): 2023/11/28(火)16:47 ID:uy7CvN4q(3/3) AAS
>>968
1回目の.*で文字列全体がマッチ、2回目でNUL文字列にマッチするのは
どの正規表現環境でも同じだと思うよ
973: 2023/11/28(火)16:49 ID:CppHkuHl(1) AAS
0文字と一致させたくなければ.*ではなく.+と書けよ
974: 2023/11/28(火)16:59 ID:fB6/42vV(1/2) AAS
>>972
Perlの文字列はNull Terminatedされてないよ
/gだとマッチできないか再度確かめるからzero-lengthのempty stringにマッチするんだとさ
でも同じ位置でempty stringに2回はマッチしないようなチェックが入ってるからそこで抜けるんだとさ

個人的にはバグだと思うけどPCRE準拠でみんな作ってるから同じ動きをさせたんだろうね
regex101で試すとRustだけが一般に期待する動作をしてる
975: 2023/11/28(火)17:02 ID:fB6/42vV(2/2) AAS
/(.*)$/みたいに末尾のアンカー入れても結果変わらないから余計におかしい
^を入れたら当然防げるけど
976: 2023/11/28(火)17:09 ID:vIU65Zk5(5/5) AAS
>>971
探したけど見つからんかった。
どこにあった? or どうやって探した?
キーワードがわからん
977: 2023/11/28(火)18:08 ID:waKUlTL5(1) AAS
これは長さゼロでマッチした直後に長さゼロにマッチしてposが進まなかったときにマッチを終了するという、頭の悪い正規表現を書くマヌケのために配慮された動作が例外的なんだよ
そのおかげで頭の悪い正規表現を書いても無限ループさせずに済んだことにむしろ感謝するべきだね
978: 2023/11/28(火)18:30 ID:mMoqXMUf(1) AAS
(ハクション!
979: 2023/11/28(火)19:16 ID:6l9rHssS(1) AAS
単に便利だからゼロ幅マッチさせてるん
$str =~ s/()/$1,/g; やってみるといいのん
980
(2): 2023/11/29(水)13:08 ID:yvH2v9xT(1/2) AAS
正規表現検索は失敗しないかぎり終わらないって話では

abcに対して(.*)$が検索される→「abc+末尾」がマッチ、この時点での位置はcの後ろのゼロ幅
残りの部分に対して再度(.*)$が検索される→「ゼロ幅+末尾」がマッチ、cの後ろのゼロ幅が消費される
残りの部分に対して再度(.*)$が検索される→対象を消費しきっているので失敗→検索終了
981: 2023/11/29(水)14:41 ID:lw8jVmFR(1/3) AAS
そういうもんだと思って使ってたわ
それをバグだと思ってる人がいてびっくりぽんや
しかしこういうことに疑問を持つ人は今後伸びるで
982: 2023/11/29(水)17:53 ID:AoutXZD6(1) AAS
>>980
その理屈で言えば1回目で対象を消費しきってるから2回目が失敗するべき

1回目で消費しきっているにも関わらず2回目のゼロ幅マッチが成功するなら3回目のゼロ幅マッチだって成功するはず
そうならないのは対象を消費しきってるかどうかを確認せずにマッチを実施しており最終的には2回連続同一箇所でのゼロ幅マッチという失敗条件に合致してはじかれているから
983: 2023/11/29(水)18:01 ID:lw8jVmFR(2/3) AAS
確かにその通りやな、1度目で消費しきっとるはずや
984: 2023/11/29(水)18:06 ID:lw8jVmFR(3/3) AAS
分かったつもりになってるだけで全然分かってへんのがおるから
ちゃんと本か何かで学習したほうがええで、今までそういう学習をしてへんやろ
985
(1): 2023/11/29(水)20:04 ID:x7bR/xfi(1) AAS
/(.*)$(.*)$((.*)$){999}/
986: 2023/11/29(水)22:25 ID:yvH2v9xT(2/2) AAS
>>985
えーと、つまり
・ゼロ幅は消費されない。パーマネントにゼロであり続ける。なので無限にマッチ可能
・無限にマッチ可能→同じゼロ幅に2回連続マッチしたからといってposを進めたり終了するわけではない
てことかな?

2回目以降が発生するかどうかは、、どうなんだろう
前回と完全に同じマッチになるときは試行せず終わる、っぽいけど
987: 2023/12/01(金)02:37 ID:07OBAnmr(1) AAS
sedの基本正規表現と拡張正規表現だとゼロ幅にマッチしないね
元はPerlのバグだったのが仕様ってことになったのでは?

$ printf 'abc' | sed 's/\(.*\)/[\1]/g'
[abc]

$ printf 'abc' | sed -E 's/(.*)/[\1]/g'
[abc]
988
(1): 2023/12/01(金)08:09 ID:RWimeGTM(1) AAS
/^\w+|$/[$&]/

これが[abc][]になるのはおかしいと感じないよね?
前半が末尾まで食い尽くすから$はマッチしないはずだと思う?
989: 2023/12/02(土)00:36 ID:/f7jnFb0(1) AAS
挙動を仕様書で厳密に定義しているJavaScriptではこうなってた
外部リンク[html]:tc39.es

・1回目のマッチが "abc" すべてを消費する
・2回目のマッチは文字列末尾から始まるけど正規表現が.*なのでマッチングに成功する
 ただし空文字にマッチした場合、先へ進まなくなることを回避するために
 次回開始位置を一つ後ろへずらす処理が入る (12.c.iii.2以下)
 これにより3回目のマッチは文字列の終端+1という範囲外の位置から始まることになり失敗に終わる
990: 2023/12/07(木)23:24 ID:Ug9Hn2aN(1/2) AAS
KEEPのKはあるのにPが無い、何故?
991: 2023/12/07(木)23:31 ID:Ug9Hn2aN(2/2) AAS
(?<=uma)musu(?=me) 柿憎い
uma\Kmusu\Pme 柿安い
992: 2023/12/10(日)09:57 ID:8JqB6SG/(1) AAS
>>988
思うよ
+の後に$を置けば余計にそう思う
993: 2023/12/10(日)13:04 ID:t3u5G9tC(1) AAS
$は「後ろが終端である位置」の指定であって「最後まで全部」という意味ではない
なので.+$で文字列を末尾まで消費した後でも再度末尾のゼロ幅にマッチできることはバグでもなんでもない
994: 2023/12/10(日)14:15 ID:ayXeZXuA(1) AAS
実装上のバグではなく仕様バグだろって話をしてるのがわからないのか?
995: 2023/12/10(日)15:43 ID:e6Tz3fj/(1/2) AAS
.*と$でマッチするものが異なるのに.*と.*|$でマッチするものが変わらないのは明らかにバクってるな
正規表現のパターンを変えるだけでperlでは[abc][]にも[abc]にもできるのにsedではこのバグのせいで[abc][]には絶対にできなくなってる

$ printf 'abc' | sed -E 's/.*|$/[&]/g'
[abc]
996: 2023/12/10(日)15:44 ID:e6Tz3fj/(2/2) AAS
s/バク/バグ/
997: 2023/12/13(水)11:48 ID:wzNHEkEB(1) AAS
ただの仕様だよ、あほらし

次スレよろ
998
(1): 2023/12/16(土)09:00 ID:KMxF6SWS(1) AAS
次スレ
2chスレ:tech
999: 2023/12/16(土)09:36 ID:pgUnJUCg(1) AAS
天地無用
1000: 2023/12/16(土)10:49 ID:faoSWywL(1) AAS
>>998
ほめてつかわす
1001
(1): 1001 ID:Thread(1/2) AAS
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 772日 14時間 59分 3秒
1002
(1): 1002 ID:Thread(2/2) AAS
5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。
運営にご協力お願いいたします。

───────────────────
《UPLIFT会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
4 USD/mon. から匿名でご購入いただけます。

▼ UPLIFT会員登録はこちら ▼
外部リンク:uplift.5ch.net

▼ UPLIFTログインはこちら ▼
2ch板:login
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.031s