[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
468: 2022/07/06(水)19:01 ID:kQhbtDqq(1) AAS
いつも文体一緒だからバレる
469: 2022/07/06(水)19:30 ID:5qGkM3IH(3/5) AAS
>> 298
「店」が無い店もあったからHTMLソースから取り出すようにしたよ
ブラウザでHTMLソースを表示させてnotepad++にソースをコピペしてから置換して
1回目の検索欄
^[^\r\n]*<h4\s+[^>]*class=["']?shopList[_\-\s]*storeName["']?[^>]*>\s*<span[^>]*>\s*</span\s*>\s*([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*
</h4\s*>(?:(?!<dd[^>]*>\s*〒|<h4)(?:[\r\n]|.))*<dd[^>]*>\s*〒\s*[\d\-]+\s+([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*</dd\s*>[^\r\n]*$
1回目の置換欄
うんこ$1,$2
2回目の検索欄
^(?!うんこ)[^\r\n]*$[\r\n]+
省6
470: 2022/07/06(水)19:34 ID:5qGkM3IH(4/5) AAS
ミスった
1回目の置換欄
( 空欄にして )
これは2回目だね
471: 2022/07/06(水)19:39 ID:5qGkM3IH(5/5) AAS
全国の店舗一覧を取得したいならwgetなどで各店舗一覧ページをローカルに保存してからnotepad++のファイル一括置換でまとめて置換したほうが楽
「wgetの使い方が分かりません」はスレ違いなのでよそで聞いて
472: 2022/07/06(水)23:10 ID:gFUK7vgi(1) AAS
ホンの少し複雑化しただけで頭の悪さや性格って浮かび上がるよねw
473: 2022/07/07(木)16:29 ID:ls1FMHZL(1) AAS
そのまま正規表現1回でやるのと、改行の種類とかあったりなかったりする要素とか明らかに不要な要素を掃除してからやるのとどっちがいいですか
474: 2022/07/07(木)16:37 ID:3hUwVJb0(1) AAS
掃除して整形してからやるのがコスパ良いに決まってる
力業いくない
475: 2022/07/07(木)17:27 ID:EezL89dt(1) AAS
ケースバイケースやろ
476: 2022/07/07(木)17:45 ID:QZNfJ5wA(1) AAS
答え合わせ出来るとか、間違いに気付き易いor間違い難いケースは1発
合ってるか分かり難い場合は間違い難い正規化式で段階踏む
477: 2022/07/08(金)12:52 ID:/znuHP85(1) AAS
パイプ・フィルターみたいに、どんどん変換していく方が分かりやすい。
処理A | 処理B | 処理C
Ruby の正規表現では、3種類の改行を、\R と書ける
/\r\n|\r|\n/
/\R/
478: 2022/07/10(日)17:44 ID:0O2dRiW8(1) AAS
>possesive
ポジティブ
479: 2022/07/16(土)01:09 ID:gUwlqT3Y(1) AAS
そして誰もいなくなった
480: 2022/07/16(土)09:09 ID:L4T2PUf2(1) AAS
民度の低い異常者が常駐してたらそりゃ関わりたくないもん
481: 2022/07/16(土)11:12 ID:WasoqaBj(1) AAS
自己紹介乙
482(1): 2022/07/20(水)06:49 ID:v4tHM0fs(1) AAS
●Regular Expressionの使用環境
秀丸
●検索か置換か?
置換
●説明
同じ文字+間に要らない文字列+同じ文字
を
同じ文字 一つにしたいです
●対象データ
[ぬるぽ & ぬるぽ]
省7
483(1): 2022/07/20(水)07:23 ID:iuCM0uSo(1) AAS
説明にない[は何?
484: 2022/07/20(水)08:35 ID:jm1i1IHH(1) AAS
>>483
すみません希望する結果はこちらでおねがいします
[ぬるぽ]
[ガッ]
[hoge]
485: 2022/07/20(水)09:04 ID:Fdf9zFh2(1) AAS
テスト
\[(.+?)(.*?\1)\](?\2)
486(1): 2022/07/20(水)16:27 ID:f63hBcuy(1) AAS
(.+).+?\1
$1
487: 2022/07/20(水)16:30 ID:OlkAUELc(1) AAS
[ wow & wow]
488: 482 2022/07/20(水)17:48 ID:VWdn2Di+(1) AAS
>>486さんの正規表現で上手くいきました
ありがとうございました
489: 2022/08/28(日)01:14 ID:y+9tLdhC(1) AAS
正規表現の先読み・後読み 外部リンク:zenn.dev
490(1): 2022/08/28(日)07:40 ID:MbqzPdhg(1) AAS
perlでは/.*hoge/より/.*?piyo/の方が圧倒的に速いのか
ステップ数は大して変わらなそうなのに
491(1): 2022/08/28(日)08:17 ID:e6Sjxbuq(1) AAS
>>490
perlに限らずそりゃそうだろ
"hoge...めっちゃ長い文字列..."
ってあったら /.*?hoge/ なら最初の hoge でマッチしたと判断できるけど /.*hoge/ だと最後まで見ないと判断できない
最後に hoge ってある可能性があるから
492(1): 2022/08/28(日)08:52 ID:7Mb5USF7(1) AAS
>>491
hogeじゃなくてpiyo
"hoge...めっちゃ長い文字列...piyo"
ってあったら /.*?piyo/ と /.*hoge/ は同じくらいだと期待するでしょ
489のコメントの比較テストを見てなんでそうなるのかなと
493: 2022/08/28(日)09:11 ID:dcB5AKwO(1) AAS
>>492
そりゃそういうケースもあるけどそうでないケースの方が多いだろ
494: 2022/08/28(日)10:55 ID:V92k17Tf(1) AAS
489の記事・コメントを見たけど
「.*hoge.*」
と
「.*?hoge」
の比較をして後者のほうが圧倒的に早いって記述はあったが
490の言ってる比較はどこにも見当たらないようだけど・・・?
492の
>hogeじゃなくてpiyo
はもっと意味不明だな
「/.*hoge/」
省3
495: 2022/08/28(日)12:06 ID:3aiLuiYL(1) AAS
マッチする場合はそれほどステップ数は変わらないけど
マッチしない場合のステップ数の差は大きいね
496: 2022/08/28(日)12:10 ID:iCw3MfJc(1) AAS
(?s:^(?=.*(?:トビラ|280|280|[内外]製|純正|公式))(?=.*(?:ガイジ|発狂|長文|必死|キチガイ|キチキチ)))
これって何か間違ってますか?280が消えない時があります
497: 2022/08/28(日)12:33 ID:4oWDpmI8(1) AAS
[22][88][00]
こういうこと?その消えない時のレス見ないと正確なことは分からんよ
後ろが一致してないのかもだし数値参照かもしれんし
498: 2022/08/28(日)14:30 ID:HKThARKH(1) AAS
なぜ組み合わせたいのかがよくわからんな
後半のパターン部分を素で書けば良いと思うんだけど、あえて暴言を目視したいスレでもあるんだろうか?
499: 2022/08/28(日)14:36 ID:q8tm2XHG(1) AAS
単発のNGの他に連鎖NGとかIDごとNGとかあるだろ
わからないなら黙ってろよ
500: 2022/08/28(日)16:16 ID:XxcpkpFs(1) AAS
ごめん
501: 2022/09/04(日)01:47 ID:0/i0sC9q(1) AAS
GNU grep 3.8 (2022-09-02)から-Pオプションのリンク先がPCRE2になったらしい
それ以前は古いPCREだった
-Pオプションが機能しないWindows版grepバイナリには関係のない話だけど
502: 2022/09/04(日)07:42 ID:pCQ9P7Vy(1) AAS
1
2
あ
10
77
100
150
1000
3桁までの数字のみをする場合
[0-9]{,3}だとダメでした
省2
503(2): 2022/09/04(日)08:41 ID:x2tuNrOY(1) AAS
外部リンク:www.simple-edition.com
[1-9]|[1-9][0-9]|1[0-9]{2}|200
で範囲を作ったものを
外部リンク:weblabo.oscasierra.net
ここに代入しても使えませんでした
「正規表現」の意味合いが違うんでしょうか?
504: 2022/09/04(日)09:08 ID:MIQciAoV(1) AAS
>>503
それだと92000の200にもマッチしてしまうよ
インド数字等を気にしないなら[0-9]は[\d]でもOK
(?<![0-9])(?:200|[1][0-9]{2}|[1-9][0-9]|[0-9])(?![0-9])
505: 2022/09/04(日)09:46 ID:ZQZ632xa(1) AAS
>>503
[0-9]{1,3}
これだと結果でるようだけどそのサイトm値省略不可なのでは
他に | のorも説明ないようなのでダメとか
正規表現文法どこまで対応してるかは動かす環境次第なので質問テンプレートにも入力項目になってんだけど
>>1
506: 2022/09/04(日)10:07 ID:qlj2b1lm(1) AAS
すまない
●Regular Expressionの使用環境
iPhone,a-shellというアプリ
●検索か置換か?
検索
●説明
フォルダ内にある写真を圧縮するため
●対象データ
1から200などのjpegとかの画像
●希望する結果
省1
507: 2022/09/04(日)10:19 ID:NNtN3+VI(1) AAS
まあ案件次第だけど
> 200までの数字だとどうしたらいいですか?
とかなら\d+で取得してアプリケーション側で弾くのが後の保守を含めて簡単かと思う
508: 2022/09/13(火)19:48 ID:aae9uQ50(1/4) AAS
スルーされにくい質問のテンプレと例
●Regular Expressionの使用環境
PowerShell7.2
●検索か置換か?
置換
●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい
●対象データ
123000444
000123000
省6
509(1): 2022/09/13(火)20:02 ID:BFM47HY2(1) AAS
(?<!^)000+(?!$)
-
510(1): 2022/09/13(火)20:23 ID:el3nukes(1) AAS
00000 → 0-0 ?
511(2): 2022/09/13(火)20:37 ID:G28B9gdh(1/4) AAS
ああ、
00001200030000
を
0-12-3-0
とするのか (>>509のやつ)
先頭末尾に繋がっている0は無視したい
000012-30000
のか例からだと不明だね
512: 2022/09/13(火)21:45 ID:aae9uQ50(2/4) AAS
508です。
早くもいろいろご回答いただきありがとうございます。
そしてすみません、みなさまのリプを見て自分の考えが足りなかったことに気付きました…
変換は一度だけ、先頭から数えてもっとも近いもののみです。
正しく書き直します、すみません。
スルーされにくい質問のテンプレと例
●Regular Expressionの使用環境
PowerShell7.2
●検索か置換か?
置換
省14
513(1): 2022/09/13(火)22:09 ID:jeF3JQfM(1) AAS
>>511
> 先頭末尾に繋がっている0は無視したい
こんな条件どこから出てきたんだ?
514: 2022/09/13(火)22:20 ID:GLLSFlxd(1) AAS
「文中(先頭及び文末以外)の0」が連続して3つ以上並ぶ部分
文中(先頭及び文末以外)の「0が連続して3つ以上並ぶ部分」
515: 2022/09/13(火)22:24 ID:clq+OpKM(1/3) AAS
^([1-9]+)0+(\d+)$ --> $1-$2
でいかがでしょう
516: 2022/09/13(火)22:33 ID:clq+OpKM(2/3) AAS
あ、「ゼロ3つ以上」を満たしてなかった
また考えますー
517: 2022/09/13(火)22:35 ID:clq+OpKM(3/3) AAS
^([1-9]+)0{3,}(\d+)$ --> $1-$2
でしょーか
518(1): 2022/09/13(火)22:46 ID:7uE/UK4/(1) AAS
010001
519(1): 2022/09/13(火)23:08 ID:G28B9gdh(2/4) AAS
>>513
> 文中(先頭及び文末以外)の0が
の説明と例からだと
「先頭以外」が先頭の0、1文字を指すのか
先頭から続く0の塊を指すのか不明でしょ
> 3つ以上並ぶ部分
が強欲なのか?欲張りでいいのか?が不明 >>511 さんの質問だね
520: 2022/09/13(火)23:09 ID:G28B9gdh(3/4) AAS
>>519
訂正、>>510さんの質問
521: 2022/09/13(火)23:10 ID:aae9uQ50(3/4) AAS
みなさんありがとうございます!
できそうな正規表現がありうれしいです。
すみませんが今手元に環境がないため明日動作させて確認します。
522: 2022/09/13(火)23:20 ID:aae9uQ50(4/4) AAS
そして自分でも要件を言葉にできておらず申し訳ありません
みなさんに質問いただいて初めて気付きましたが、
先頭及び末尾が0であった場合、そこから連続する0は除外する ができると一番望ましいです。
00001200034000
↓
000012-34000
となります。
返信遅くなりすみません。
523(1): 2022/09/13(火)23:44 ID:G28B9gdh(4/4) AAS
(?<!^)(?>0{3,})(?!$)
未test
最初のマッチだけ置換は以下
外部リンク:social.technet.microsoft.com
524(1): 2022/09/14(水)00:51 ID:4SNfctPQ(1) AAS
>>518
あかんすね…
^(0*)((0{0,2}[1-9])+)0{3,}([1-9]\d*)$ --> $1$2-$4
これはどーでしょう?
525(1): 2022/09/14(水)05:23 ID:E5sTi1VY(1) AAS
([1-9])0000*([1-9][0-9]*)
$1-$2
526(1): 2022/09/14(水)09:12 ID:Kn3Wl+2J(1) AAS
(?<=[1-9])(?>000+)(?!$)(.+)$
-$1
527(1): 2022/09/14(水)09:38 ID:s0UMl1ds(1) AAS
(^[^0].*?)0{3,}([^0].*?$)
$1-$2
528: 2022/09/14(水)10:42 ID:6Qq1IObP(1) AAS
○ >>524,525,526
✕ >>523,527
529: 2022/09/14(水)19:22 ID:+0SwTq6N(1/2) AAS
508です。
沢山の案ありがとうございました、本当に助かりました。
一通り試して正しく動くものは沢山あったのですが、
以下の方式で解決させていただきました。
$reg=[regex]'([1-9])0000*([1-9][0-9]*)'
$reg.Replace($str,'$1-$2',1)
また、上記の案以外もこんな解決方法があるのかととても勉強になりました。
そして自分が要件をまとめられてなかったことにも反省いたしました。
今後はこちらで回答する側になれるよう、再度勉強いたします。
重ね重ね本当にありがとうございました。
530(1): 2022/09/14(水)19:57 ID:b2aEm1i9(1) AAS
回答にある正規表現は置換回数を指定できない置換方法でも大丈夫
置換回数に1を指定する方法でやるなら単に ([1-9])0000*([1-9]) でもいい
531: 2022/09/14(水)22:22 ID:+0SwTq6N(2/2) AAS
>530
確かに、教えていただいたこともりもりにしてしまいましたが
わざわざ[1-9]のあとに[0-9]を入れている意味がないですね…。
ご指摘ありがとうございます。
532(1): 2022/09/18(日)12:56 ID:QaJ1iFM2(1) AAS
githubで結構探したんですがそれっぽいのが見つからず、お力お貸しください。
●Regular Expressionの使用環境
AutoHotKey1.1系
●検索か置換か?
置換
●説明
2つのクォーテーションマークに囲まれたパスのうち、1つ目(app.exe)を削除したい。
囲まれたパス同士は半角スペースで接続される。
●対象データ
"D:\Dir_Path\_app.exe" "D:\Dir_Path\_script.ahk"
省3
533(1): 2022/09/18(日)16:16 ID:wjpqonb4(1) AAS
>>532
外部リンク:regex101.com
534: 2022/09/18(日)19:20 ID:/uA/jgNo(1) AAS
>>533
ありがとうございますめちゃくちゃシンプルでした!あとこのregexサービスいいですね
".*"\s だと構文エラー吐きました
置換関数内(””の中)で”がうまく扱えないので頑張ってみます。
535(1): 2022/09/18(日)21:26 ID:CbZe8FP4(1) AAS
"を
\"
や
\x22
に置き換えて試してみてわ
536: 2022/09/19(月)16:41 ID:4iw9Mtek(1) AAS
>>535
ありがとうございます、いけました
(ついでに””も削除)
\x22.*\x22\s|\x22
537: 2022/09/20(火)02:58 ID:94I1wBUa(1) AAS
二重引用符のエスケープは重ねて""だな
"".*""\s
538(1): 2022/10/29(土)13:09 ID:ec13kmtS(1/2) AAS
●Regular Expressionの使用環境
PCRE2
●検索か置換か?
検索
●説明
(..[\0@-g]\0){147}などを高速に検索したい
●対象データ
メガ単位のバイナリファイル(リトルエンディアン)
●希望する結果
説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で
省11
539(1): 2022/10/29(土)19:31 ID:9Ey1MUJ8(1) AAS
>>538
\0@って何?
\c@でNULL文字検索の意味ではないの?
540: 2022/10/29(土)19:42 ID:ec13kmtS(2/2) AAS
>>539
文字クラス[\0@-g]なので表記を統一するなら[\x00\x40-\x67]になります
541(2): 2022/10/30(日)10:24 ID:dZd+t5oq(1) AAS
スプレッドシートで20221030と入力されている数字を日付の表記?2022/10/30なのか10/30/2022なのかわからないけどDATEDIF関数に使える形に置換する正規表現ってどう書きますでしょうか
542(1): 2022/10/30(日)11:55 ID:oF72FRjI(1) AAS
>>541
正規表現では無理。スレチ
DATE関数で日付にかDATEVALUE関数でシリアル値に変換
セルA1の値:20221030
=DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2))
=DATEDIF(DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2)),"2022/11/01","D")
543: 2022/10/30(日)12:28 ID:S1PTRz+V(1) AAS
>>541
=DATEVALUE(REGEXREPLACE(A1, "^(....)(..)(..)$", "$1/$2/$3"))
>>542
スレチ
544: 2022/11/02(水)14:16 ID:gx4Z74sz(1/3) AAS
すいません。
0と正の整数のみにマッチする正規表現はどう書きますか
----
OK
0
1
22
303
999999
----
省4
545: 2022/11/02(水)14:20 ID:4jxQNd6r(1) AAS
^\d+$
546: 2022/11/02(水)14:26 ID:gx4Z74sz(2/3) AAS
ありがとうございました!
547(1): 2022/11/02(水)14:39 ID:Hz9+pCnD(1) AAS
00
00000000
012
003102
とかはええんかC言語だと8進数なんだけど
548: 2022/11/02(水)14:57 ID:mLb2a5cx(1) AAS
最近は8進数を0oと書くのが主流じゃね?
549: 2022/11/02(水)15:14 ID:gx4Z74sz(3/3) AAS
いやよくないのですが。。
550: 2022/11/02(水)22:52 ID:WMtJS4K4(1) AAS
>>547
なぜC言語?
551: 2022/11/03(木)13:08 ID:yr3S2O5F(1) AAS
^(?:0|[1-9]\d*+)$
552(1): 2022/11/03(木)23:35 ID:gGr9RQjz(1) AAS
A(B(1), C(2)), B(3), C(4), A(D(5))の
A(B(1), C(2))とA(D(5))の両方にマッチする表現できますでしょうか?
553(1): 2022/11/04(金)00:21 ID:Rv2RlvZT(1) AAS
A\([BD]\([15]\)(, C\(2\))?\)
554(1): 2022/11/04(金)00:32 ID:u3TD418O(1) AAS
>>552
関数名は英数字1文字、ネストされた関数の引数は数字1文字にしてるけどこんな感じでいけるかと
\w\(\w\(\d\)(?:,\s*\w\(\d\))*\)
画像リンク[jpg]:i.imgur.com
555: 2022/11/04(金)19:23 ID:aOu/uEdM(1) AAS
>>553-554
参考になりました
ありがとうございます
556(1): 2022/11/05(土)19:55 ID:xnenmrxP(1/2) AAS
下のようなテキストがあった時、
フシギダネ、たねポケモン。生まれてから、しばらくの間は背中のタネから栄養をもらって大きく育つ。
フシギソウ、たねポケモン。背中のつぼみがふくらみだすと、あまい匂いが漂い始める。
フシギバナ、たねポケモン。雨の降った翌日は、背中の花の香りが強まる。
その行で最初に出てきた「、」だけをTabで置換したいのですが、
正規表現でなんとかできますかね?(´・ω・`)
557: 2022/11/05(土)19:57 ID:Gow5Zgrm(1) AAS
顔文字が気持ち悪い
558: 2022/11/05(土)19:57 ID:KyEMh/LJ(1) AAS
マルチラインモードのg無し置換でええのでは?
559(1): 2022/11/05(土)20:01 ID:xnenmrxP(2/2) AAS
すみません。7分で自己解決しました。(´・ω・`)
560(1): 2022/11/06(日)18:52 ID:Ju9kLy6l(1) AAS
>>559.replace('(´・ω・`)', '');
561: 2022/11/06(日)18:56 ID:gpiofWbc(1) AAS
>>560
エスケープしろ
562: 2022/12/01(木)00:48 ID:7b6m1q/M(1) AAS
師走だ
563: 2022/12/01(木)20:43 ID:MJwbaGOX(1) AAS
>>556
^(.*?)、(.*)$ → $1¥t$2
564(2): 2022/12/07(水)17:35 ID:hI2dpmO3(1) AAS
正規表現はコードを分かりにくくする非常に悪い技術だと思います。
早く廃止され、代替方法が見つかってほしいです。
565: 2022/12/07(水)18:06 ID:Zr5hf/of(1) AAS
それは思うけどqwertyキーボードですらこの半世紀何も変わってないし、Legacy引き摺る類のUIは余程の転換期でも起こらない限り無理なんじゃないかな
566: 2022/12/07(水)18:23 ID:IT7suRvF(1) AAS
>>564
わかりやすくて使い物にならないものができあがる予感
567: 2022/12/07(水)18:33 ID:8ZB5Tvh5(1) AAS
物事の「本質的な複雑さ」を解決しようとしても「その場でぐるぐる回り続ける」ハメになるだけ(どこにもたどり着くことはない)
上下前次1-新書関写板覧索設栞歴
あと 435 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.043s