[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
444: デフォルトの名無しさん [sage] 2022/07/05(火) 20:11:53.67 ID:4sOf+wSV(7/7) AAS
>>441
Oracleは日本語を正とせず英語を正としろって立場を採ってるよね
誤訳がありうるってことだし、誤訳によりライセンス内容の整合性がとれなくなったMSの事例もあるね
445: デフォルトの名無しさん [sage] 2022/07/05(火) 20:25:49.94 ID:mmXAp8Yt(1/2) AAS
なんだなんだ
「強欲」って用語が指していることを理解してなくて会話がかみ合わなかった週末の人、
数日経ってもまだ「ぼくちゃんまちがってないもんえいごだとこうなんだもん」って駄々こねて80レス位進んでるのか・・・・・

ちょっとした勘違いとかちゃんとした日本語のドキュメントに目を通してなかったとか誰にでもあることなんだから
それこそ貧欲って書いてた人みたいに一言間違ってたわwって言うくらいで収まることだと思うんだけどなあ
悪いけどやってること恥の上塗りだよ?
446: デフォルトの名無しさん [sage] 2022/07/05(火) 20:35:51.78 ID:K5Eu4yGw(6/6) AAS
もう ひんよく と きょうよく でいいよ
447: デフォルトの名無しさん [sage] 2022/07/05(火) 22:07:33.30 ID:mmXAp8Yt(2/2) AAS
同一人物のくせに他人のフリとかどんだけ面の皮厚いんだよ・・・とか一瞬思ったけど
ID:K5Eu4yGwID:nkFK6+7O ID:4sOf+wSV は別人だったのか
見分けついてなくて同一レベルのゴミかと思ってたわごめん
448: デフォルトの名無しさん [sage] 2022/07/05(火) 22:30:45.62 ID:JtY8aViY(1) AAS
口語だと基本的に最短一致、最長一致、バックトラックしない最長一致って言ってる
欲張りとか強欲とか実際に口に出して言ってる人には出会ったことないわ
449: デフォルトの名無しさん [sage] 2022/07/05(火) 22:50:11.96 ID:MNnvUB1p(1) AAS
(非探索)最長一致
(最)多一致
(最)少一致
どちらも「最長」だと紛らわしさがあるので
でも「強欲」で定着しているものをわざわざ言い換える程の事でも無いと思う
450: 426 [sage] 2022/07/06(水) 00:22:09.50 ID:ToTyGXGb(1) AAS
>>428
\x0085を\x{0085}に変えて
[\s&&[^\r\n\x{0085}\x{2028}\x{2029}]]でOKでした
積演算&&の有効な使い方を初めて知りました
どうもありがとうございました
451: デフォルトの名無しさん [sage] 2022/07/06(水) 02:03:37.65 ID:7JN09BFV(1) AAS
\R*+\K\s
452: デフォルトの名無しさん [sage] 2022/07/06(水) 05:39:49.51 ID:FCzm9xaa(1) AAS
口頭ってことは対面レビューとか他の人と共有するソースコードでの正規表現だよね?
そうなると、相手のスキルレベルにもよるけど
「強欲」って単語だけでなく強欲な正規表現自体も避けておくかなあ
このスレのうんざりする流れを見てもわかるとおり「強欲」が相手に通じるとは限らないし
(強欲な正規表現なんて使ったことがない人のほうが多数派だろうし)
最長一致で事足りるなら多少のパフォーマンス悪化には目をつぶる

チャットとかなら「++」みたいな具体例を明示して「強欲」って単語を使うかな
ここみたいな正規表現スレならなにも前提を置かなくとも普通に「強欲」で通じるものとして会話するけど・・・
会話が成り立たなかったうえに間違いを指摘されても「英語だと」「口語だと」「xxxだと」とか延々ゴネる人とは会話したくないなあ
いい加減NGしたいからコテつけてくれるとありがたい
453
(1): デフォルトの名無しさん [sage] 2022/07/06(水) 06:39:20.23 ID:5qGkM3IH(1/5) AAS
しかし回答者のレベル低下が酷いな
ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな
$1,$2の件や強欲のすれ違いについても積極的に事態の収集を図ろうとせず悪化させて悪乗りするとはね
454: デフォルトの名無しさん [sage] 2022/07/06(水) 06:47:28.85 ID:TTp+bFLp(1) AAS
英語名を変えさせたら良い
gohyork
yorkvary
muyork

対応して日本語名もカタカナ表記で
ゴヨーク
ヨークバリー
ムヨーク

そういう『名前』としてしまえば解決
一意な名称を与えた方が誤解も少なくなるだろう

> 強欲な正規表現なんて使ったことがない人のほうが多数派だろうし
それはあまりにもレベルが低すぎじゃね?
知らない者が学ぶべきであって触りすらも学んだことの無い者へ合わせる必要なんて無い
455: 298 [] 2022/07/06(水) 06:53:49.49 ID:ZAN9ui5m(1/3) AAS
>>361
> それ書いてる>>314には$1なんてどこにも書いて無いのにw
つまり、>>314の「,」があまりに小さくて見えなくて、
(?<=店)[^〒]*?〒\d{3}-\d{4}\s++
これしか書いてなくて、
2行目の$1,$2を省略したと思ったのですw
456: デフォルトの名無しさん [sage] 2022/07/06(水) 07:02:49.27 ID:5qGkM3IH(2/5) AAS
ここの回答者はそう勘違いしてるのを知ってて何も助言しなかったんだぞ、馬鹿にして笑ってたんだよ
このスレは過疎たせいで悪質な初心者が上級者ヅラするようになってしまった
457
(1): 298 [] 2022/07/06(水) 07:06:06.70 ID:ZAN9ui5m(2/3) AAS
秋葉原店
専門店

住所
〒101-0021 東京都千代田区外神田4丁目3-3
TEL
0570-024-511


で、さらに教えて欲しいのですが、
前回と同じ質問ですが、
店名と住所を抽出したいです。
で、↓を使いたいのですが、
店を抽出キーワードにすると、専門店とか店舗詳細とかの「店」も拾ってしまうのです。
で、データをよくみると、「 秋葉原店」のように店名の前にスペースがあります。
で、
( )(?<=店)[^〒]*〒\d{3}-\d{4}\s++ と、やってみたのですがダメでした。 どうすればよいでしょうか?

(?<=店)[^〒]*〒\d{3}-\d{4}\s++  ←は>>314さんの教えてくれたヤツ。
458: デフォルトの名無しさん [sage] 2022/07/06(水) 07:09:45.51 ID:SZC2q9b+(1) AAS
これ非包含演算子に粘着してるのと同じやつだろ
粘着気質と承認欲求丸出しのマウンティング気質が全く同じ
459
(1): デフォルトの名無しさん [sage] 2022/07/06(水) 07:46:05.23 ID:o/55z/m0(1) AAS
>>453
再質問来てるぞ
> ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな
おまえがお手本見せてやれや
回答者をバカにするくらいだから余裕だろ?

>>457
>>320
使い方分からないならJSスレか初心者スレ行って聞いたらいい
460: 298 [] 2022/07/06(水) 08:07:45.17 ID:ZAN9ui5m(3/3) AAS
>>459
↓って英語だからどうやって使っていいのかわかりません。

https://pastebin.com/M6LqV15b
461: デフォルトの名無しさん [] 2022/07/06(水) 11:44:54.56 ID:MXaUuSJv(1/2) AAS
まず英語の勉強をするべき
462
(2): デフォルトの名無しさん [sage] 2022/07/06(水) 12:10:15.16 ID:c6fRPAAn(1/2) AAS
CSV の正規表現なんて、数千行ぐらい掛かるだろ。
HTTP の正規表現でも膨大だろ

行区切り文字の改行
列区切り文字のカンマ

クォート文字のダブルクォーテーション。
クォート文字が無くても、意味が変わらなければ省略できる

クォート文字内では、行区切り文字・列区切り文字の効果がなくなり、単なる文字となる。
クォート文字内で、連続した2つのクォート文字を使えば、
クォート文字の効果がなくなり、単なる1つのクォート文字となる

もし、クォート文字の対応関係が崩れたらエラー。
クォート文字の数は、必ず偶数個である

こんな膨大な条件判断を書けるわけない。
条件判断とか構造があるものは、正規表現では無理。
こういうものは、Ruby などのパーサーを使わないと無理

CSVをawk などで処理している香具師とか、CSVの構造を分かっていないから、
こういう特別な意味をもつ文字が混じると、バグル
463: デフォルトの名無しさん [sage] 2022/07/06(水) 13:40:21.16 ID:gR1YTmZs(1/2) AAS
>>462
なんでCSVのパースする前提になってるんだ?
webの店舗情報のテキストをCSVにするのになんでクォート内の対応を気にする必要がある?
464: デフォルトの名無しさん [] 2022/07/06(水) 15:43:31.34 ID:MXaUuSJv(2/2) AAS
KEИTAはでたらめ
465
(1): 462 [sage] 2022/07/06(水) 17:15:52.66 ID:c6fRPAAn(2/2) AAS
行区切り文字の改行、列区切り文字のカンマ、
クォート文字のダブルクォーテーション

CSV データ内に、こういう特別な意味をもつ文字が混じると、バグル

これらの文字が無ければ、Ruby などのCSVパーサーを使わずに、
awk などで処理しても、バグらない
466: デフォルトの名無しさん [sage] 2022/07/06(水) 17:19:01.24 ID:QeuQIz9d(1) AAS
なんか話脱線マウントしまくって会議やコードレビュー下手くそで顰蹙を買いまくってそうな人来てるやん
467: デフォルトの名無しさん [sage] 2022/07/06(水) 17:55:19.63 ID:gR1YTmZs(2/2) AAS
>>465
混ぜなきゃいいのでは
468: デフォルトの名無しさん [sage] 2022/07/06(水) 19:01:53.46 ID:kQhbtDqq(1) AAS
いつも文体一緒だからバレる
469: デフォルトの名無しさん [sage] 2022/07/06(水) 19:30:39.95 ID:5qGkM3IH(3/5) AAS
>> 298

「店」が無い店もあったからHTMLソースから取り出すようにしたよ
ブラウザでHTMLソースを表示させてnotepad++にソースをコピペしてから置換して

1回目の検索欄
^[^\r\n]*<h4\s+[^>]*class=["']?shopList[_\-\s]*storeName["']?[^>]*>\s*<span[^>]*>\s*</span\s*>\s*([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*
</h4\s*>(?:(?!<dd[^>]*>\s*〒|<h4)(?:[\r\n]|.))*<dd[^>]*>\s*〒\s*[\d\-]+\s+([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*</dd\s*>[^\r\n]*$

1回目の置換欄
うんこ$1,$2

2回目の検索欄
^(?!うんこ)[^\r\n]*$[\r\n]+

1回目の置換欄
( 空欄にして )

2回の置換が終われば店舗一覧が完成しているはず

1回目の検索欄は長すぎるから2行に分割したよ、1行に繋げてから使って
検索欄や置換欄に記入するときは前後に余計なスペースやタブ文字が紛れ込まないように

HTMLの細かい変化にはなるべく対応出来るようにしたけど店舗一覧のページがリニューアルしたら使えなくなるよ
470: デフォルトの名無しさん [sage] 2022/07/06(水) 19:34:28.40 ID:5qGkM3IH(4/5) AAS
ミスった

1回目の置換欄
( 空欄にして )

これは2回目だね
471: デフォルトの名無しさん [sage] 2022/07/06(水) 19:39:45.64 ID:5qGkM3IH(5/5) AAS
全国の店舗一覧を取得したいならwgetなどで各店舗一覧ページをローカルに保存してからnotepad++のファイル一括置換でまとめて置換したほうが楽
「wgetの使い方が分かりません」はスレ違いなのでよそで聞いて
472: デフォルトの名無しさん [sage] 2022/07/06(水) 23:10:34.54 ID:gFUK7vgi(1) AAS
ホンの少し複雑化しただけで頭の悪さや性格って浮かび上がるよねw
473: デフォルトの名無しさん [sage] 2022/07/07(木) 16:29:53.46 ID:ls1FMHZL(1) AAS
そのまま正規表現1回でやるのと、改行の種類とかあったりなかったりする要素とか明らかに不要な要素を掃除してからやるのとどっちがいいですか
474: デフォルトの名無しさん [sage] 2022/07/07(木) 16:37:27.46 ID:3hUwVJb0(1) AAS
掃除して整形してからやるのがコスパ良いに決まってる
力業いくない
475: デフォルトの名無しさん [sage] 2022/07/07(木) 17:27:59.03 ID:EezL89dt(1) AAS
ケースバイケースやろ
476: デフォルトの名無しさん [sage] 2022/07/07(木) 17:45:22.88 ID:QZNfJ5wA(1) AAS
答え合わせ出来るとか、間違いに気付き易いor間違い難いケースは1発
合ってるか分かり難い場合は間違い難い正規化式で段階踏む
477: デフォルトの名無しさん [sage] 2022/07/08(金) 12:52:02.00 ID:/znuHP85(1) AAS
パイプ・フィルターみたいに、どんどん変換していく方が分かりやすい。
処理A | 処理B | 処理C

Ruby の正規表現では、3種類の改行を、\R と書ける

/\r\n|\r|\n/

/\R/
478: デフォルトの名無しさん [sage] 2022/07/10(日) 17:44:55.47 ID:0O2dRiW8(1) AAS
>possesive

ポジティブ
479: デフォルトの名無しさん [sage] 2022/07/16(土) 01:09:47.27 ID:gUwlqT3Y(1) AAS
そして誰もいなくなった
480: デフォルトの名無しさん [sage] 2022/07/16(土) 09:09:55.88 ID:L4T2PUf2(1) AAS
民度の低い異常者が常駐してたらそりゃ関わりたくないもん
481: デフォルトの名無しさん [sage] 2022/07/16(土) 11:12:47.12 ID:WasoqaBj(1) AAS
自己紹介乙
482
(1): デフォルトの名無しさん [] 2022/07/20(水) 06:49:04.62 ID:v4tHM0fs(1) AAS
●Regular Expressionの使用環境
秀丸

●検索か置換か?
置換

●説明
同じ文字+間に要らない文字列+同じ文字

同じ文字 一つにしたいです

●対象データ
[ぬるぽ & ぬるぽ]
[ガッ-ガッ]
[hoge & hoge]

●希望する結果
ぬるぽ
ガッ
hoge

よろしくお願いいたします。
483
(1): デフォルトの名無しさん [sage] 2022/07/20(水) 07:23:49.75 ID:iuCM0uSo(1) AAS
説明にない[は何?
484: デフォルトの名無しさん [sage] 2022/07/20(水) 08:35:20.99 ID:jm1i1IHH(1) AAS
>>483
すみません希望する結果はこちらでおねがいします
[ぬるぽ]
[ガッ]
[hoge]
485: デフォルトの名無しさん [sage] 2022/07/20(水) 09:04:35.27 ID:Fdf9zFh2(1) AAS
テスト
\[(.+?)(.*?\1)\](?\2)
486
(1): デフォルトの名無しさん [sage] 2022/07/20(水) 16:27:05.86 ID:f63hBcuy(1) AAS
(.+).+?\1
$1
487: デフォルトの名無しさん [sage] 2022/07/20(水) 16:30:30.08 ID:OlkAUELc(1) AAS
[ wow & wow]
488: 482 [sage] 2022/07/20(水) 17:48:38.07 ID:VWdn2Di+(1) AAS
>>486さんの正規表現で上手くいきました
ありがとうございました
489: デフォルトの名無しさん [] 2022/08/28(日) 01:14:30.52 ID:y+9tLdhC(1) AAS
正規表現の先読み・後読み https://zenn.dev/usamik26/articles/regex-lookahead
490
(1): デフォルトの名無しさん [sage] 2022/08/28(日) 07:40:58.02 ID:MbqzPdhg(1) AAS
perlでは/.*hoge/より/.*?piyo/の方が圧倒的に速いのか
ステップ数は大して変わらなそうなのに
491
(1): デフォルトの名無しさん [sage] 2022/08/28(日) 08:17:37.04 ID:e6Sjxbuq(1) AAS
>>490
perlに限らずそりゃそうだろ
"hoge...めっちゃ長い文字列..."
ってあったら /.*?hoge/ なら最初の hoge でマッチしたと判断できるけど /.*hoge/ だと最後まで見ないと判断できない
最後に hoge ってある可能性があるから
492
(1): デフォルトの名無しさん [sage] 2022/08/28(日) 08:52:32.95 ID:7Mb5USF7(1) AAS
>>491
hogeじゃなくてpiyo

"hoge...めっちゃ長い文字列...piyo"
ってあったら /.*?piyo/ と /.*hoge/ は同じくらいだと期待するでしょ
489のコメントの比較テストを見てなんでそうなるのかなと
493: デフォルトの名無しさん [sage] 2022/08/28(日) 09:11:11.32 ID:dcB5AKwO(1) AAS
>>492
そりゃそういうケースもあるけどそうでないケースの方が多いだろ
494: デフォルトの名無しさん [sage] 2022/08/28(日) 10:55:00.88 ID:V92k17Tf(1) AAS
489の記事・コメントを見たけど
「.*hoge.*」

「.*?hoge」
の比較をして後者のほうが圧倒的に早いって記述はあったが
490の言ってる比較はどこにも見当たらないようだけど・・・?

492の
>hogeじゃなくてpiyo
はもっと意味不明だな
「/.*hoge/」
「/.*?piyo/」
の違いで、491は「.*」「.*?」の違いで速さが変わるのが当たり前って話をしてるのに
"hoge...めっちゃ長い文字列...piyo"みたいな極端な例を突然出してこられても
495: デフォルトの名無しさん [sage] 2022/08/28(日) 12:06:13.62 ID:3aiLuiYL(1) AAS
マッチする場合はそれほどステップ数は変わらないけど
マッチしない場合のステップ数の差は大きいね
496: デフォルトの名無しさん [sage] 2022/08/28(日) 12:10:20.88 ID:iCw3MfJc(1) AAS
(?s:^(?=.*(?:トビラ|280|280|[内外]製|純正|公式))(?=.*(?:ガイジ|発狂|長文|必死|キチガイ|キチキチ)))

これって何か間違ってますか?280が消えない時があります
497: デフォルトの名無しさん [sage] 2022/08/28(日) 12:33:21.57 ID:4oWDpmI8(1) AAS
[22][88][00]
こういうこと?その消えない時のレス見ないと正確なことは分からんよ
後ろが一致してないのかもだし数値参照かもしれんし
498: デフォルトの名無しさん [sage] 2022/08/28(日) 14:30:01.62 ID:HKThARKH(1) AAS
なぜ組み合わせたいのかがよくわからんな
後半のパターン部分を素で書けば良いと思うんだけど、あえて暴言を目視したいスレでもあるんだろうか?
499: デフォルトの名無しさん [sage] 2022/08/28(日) 14:36:53.39 ID:q8tm2XHG(1) AAS
単発のNGの他に連鎖NGとかIDごとNGとかあるだろ
わからないなら黙ってろよ
500: デフォルトの名無しさん [sage] 2022/08/28(日) 16:16:08.48 ID:XxcpkpFs(1) AAS
ごめん
501: デフォルトの名無しさん [] 2022/09/04(日) 01:47:12.24 ID:0/i0sC9q(1) AAS
GNU grep 3.8 (2022-09-02)から-Pオプションのリンク先がPCRE2になったらしい
それ以前は古いPCREだった
-Pオプションが機能しないWindows版grepバイナリには関係のない話だけど
502: デフォルトの名無しさん [sage] 2022/09/04(日) 07:42:45.45 ID:pCQ9P7Vy(1) AAS
1
2

10
77
100
150
1000

3桁までの数字のみをする場合
[0-9]{,3}だとダメでした
正規表現チェッカーでいろいろ試しているですが分かりません
200までの数字だとどうしたらいいですか?
503
(2): デフォルトの名無しさん [sage] 2022/09/04(日) 08:41:45.13 ID:x2tuNrOY(1) AAS
https://www.simple-edition.com/prog_memo/number_range_regexp/

[1-9]|[1-9][0-9]|1[0-9]{2}|200
で範囲を作ったものを

https://weblabo.oscasierra.net/tools/regex/

ここに代入しても使えませんでした
「正規表現」の意味合いが違うんでしょうか?
504: デフォルトの名無しさん [sage] 2022/09/04(日) 09:08:03.10 ID:MIQciAoV(1) AAS
>>503
それだと92000の200にもマッチしてしまうよ
インド数字等を気にしないなら[0-9]は[\d]でもOK

(?<![0-9])(?:200|[1][0-9]{2}|[1-9][0-9]|[0-9])(?![0-9])
505: デフォルトの名無しさん [] 2022/09/04(日) 09:46:10.78 ID:ZQZ632xa(1) AAS
>>503
[0-9]{1,3}
これだと結果でるようだけどそのサイトm値省略不可なのでは
他に | のorも説明ないようなのでダメとか

正規表現文法どこまで対応してるかは動かす環境次第なので質問テンプレートにも入力項目になってんだけど
>>1
506: デフォルトの名無しさん [sage] 2022/09/04(日) 10:07:01.01 ID:qlj2b1lm(1) AAS
すまない

●Regular Expressionの使用環境
iPhone,a-shellというアプリ

●検索か置換か?
検索

●説明
フォルダ内にある写真を圧縮するため

●対象データ
1から200などのjpegとかの画像
●希望する結果
検索してそれをまとめて圧縮
507: デフォルトの名無しさん [sage] 2022/09/04(日) 10:19:49.12 ID:NNtN3+VI(1) AAS
まあ案件次第だけど
> 200までの数字だとどうしたらいいですか?
とかなら\d+で取得してアプリケーション側で弾くのが後の保守を含めて簡単かと思う
508: デフォルトの名無しさん [sage] 2022/09/13(火) 19:48:53.80 ID:aae9uQ50(1/4) AAS
スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
PowerShell7.2

●検索か置換か?
置換

●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい

●対象データ
123000444
000123000
1230000000444

●希望する結果
123-444
000123000
123-444

よろしくお願いいたします。
509
(1): デフォルトの名無しさん [sage] 2022/09/13(火) 20:02:34.86 ID:BFM47HY2(1) AAS
(?<!^)000+(?!$)
-
510
(1): デフォルトの名無しさん [sage] 2022/09/13(火) 20:23:28.22 ID:el3nukes(1) AAS
00000 → 0-0 ?
511
(2): デフォルトの名無しさん [sage] 2022/09/13(火) 20:37:38.14 ID:G28B9gdh(1/4) AAS
ああ、
00001200030000

0-12-3-0
とするのか (>>509のやつ)
先頭末尾に繋がっている0は無視したい
000012-30000
のか例からだと不明だね
512: デフォルトの名無しさん [sage] 2022/09/13(火) 21:45:26.67 ID:aae9uQ50(2/4) AAS
508です。
早くもいろいろご回答いただきありがとうございます。
そしてすみません、みなさまのリプを見て自分の考えが足りなかったことに気付きました…
変換は一度だけ、先頭から数えてもっとも近いもののみです。
正しく書き直します、すみません。

スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
PowerShell7.2

●検索か置換か?
置換

●説明
文中(先頭及び文末以外)の0が連続して3つ以上並ぶ部分をハイフン(-)に置換したい
(先頭から数えて最初の一致のみ)

●対象データ
123000444
000123000
1230000000444
12000045600006

●希望する結果
123-444
000123000
123-444
12-45600006

よろしくお願いいたします。
513
(1): デフォルトの名無しさん [sage] 2022/09/13(火) 22:09:54.11 ID:jeF3JQfM(1) AAS
>>511
> 先頭末尾に繋がっている0は無視したい
こんな条件どこから出てきたんだ?
514: デフォルトの名無しさん [sage] 2022/09/13(火) 22:20:12.97 ID:GLLSFlxd(1) AAS
「文中(先頭及び文末以外)の0」が連続して3つ以上並ぶ部分
文中(先頭及び文末以外)の「0が連続して3つ以上並ぶ部分」
515: デフォルトの名無しさん [sage] 2022/09/13(火) 22:24:49.17 ID:clq+OpKM(1/3) AAS
^([1-9]+)0+(\d+)$ --> $1-$2
でいかがでしょう
516: デフォルトの名無しさん [sage] 2022/09/13(火) 22:33:07.80 ID:clq+OpKM(2/3) AAS
あ、「ゼロ3つ以上」を満たしてなかった
また考えますー
517: デフォルトの名無しさん [sage] 2022/09/13(火) 22:35:39.26 ID:clq+OpKM(3/3) AAS
^([1-9]+)0{3,}(\d+)$ --> $1-$2
でしょーか
518
(1): デフォルトの名無しさん [sage] 2022/09/13(火) 22:46:39.11 ID:7uE/UK4/(1) AAS
010001
519
(1): デフォルトの名無しさん [sage] 2022/09/13(火) 23:08:19.66 ID:G28B9gdh(2/4) AAS
>>513
> 文中(先頭及び文末以外)の0が
の説明と例からだと
「先頭以外」が先頭の0、1文字を指すのか
先頭から続く0の塊を指すのか不明でしょ
> 3つ以上並ぶ部分
が強欲なのか?欲張りでいいのか?が不明 >>511 さんの質問だね
520: デフォルトの名無しさん [sage] 2022/09/13(火) 23:09:06.59 ID:G28B9gdh(3/4) AAS
>>519
訂正、>>510さんの質問
521: デフォルトの名無しさん [sage] 2022/09/13(火) 23:10:13.89 ID:aae9uQ50(3/4) AAS
みなさんありがとうございます!
できそうな正規表現がありうれしいです。
すみませんが今手元に環境がないため明日動作させて確認します。
522: デフォルトの名無しさん [sage] 2022/09/13(火) 23:20:09.73 ID:aae9uQ50(4/4) AAS
そして自分でも要件を言葉にできておらず申し訳ありません
みなさんに質問いただいて初めて気付きましたが、
先頭及び末尾が0であった場合、そこから連続する0は除外する ができると一番望ましいです。

00001200034000

000012-34000
となります。
返信遅くなりすみません。
523
(1): デフォルトの名無しさん [sage] 2022/09/13(火) 23:44:59.39 ID:G28B9gdh(4/4) AAS
(?<!^)(?>0{3,})(?!$)
未test
最初のマッチだけ置換は以下
https://social.technet.microsoft.com/Forums/ja-JP/ad0f7263-3fd1-4545-b554-e796d27ef948/263682102112398125101248312481?forum=powershellja
524
(1): デフォルトの名無しさん [sage] 2022/09/14(水) 00:51:16.34 ID:4SNfctPQ(1) AAS
>>518
あかんすね…

^(0*)((0{0,2}[1-9])+)0{3,}([1-9]\d*)$ --> $1$2-$4
これはどーでしょう?
525
(1): デフォルトの名無しさん [sage] 2022/09/14(水) 05:23:58.73 ID:E5sTi1VY(1) AAS
([1-9])0000*([1-9][0-9]*)
$1-$2
526
(1): デフォルトの名無しさん [sage] 2022/09/14(水) 09:12:22.80 ID:Kn3Wl+2J(1) AAS
(?<=[1-9])(?>000+)(?!$)(.+)$
-$1
527
(1): デフォルトの名無しさん [sage] 2022/09/14(水) 09:38:59.41 ID:s0UMl1ds(1) AAS
(^[^0].*?)0{3,}([^0].*?$)
$1-$2
528: デフォルトの名無しさん [sage] 2022/09/14(水) 10:42:18.62 ID:6Qq1IObP(1) AAS
>>524,525,526
>>523,527
529: デフォルトの名無しさん [sage] 2022/09/14(水) 19:22:12.74 ID:+0SwTq6N(1/2) AAS
508です。
沢山の案ありがとうございました、本当に助かりました。
一通り試して正しく動くものは沢山あったのですが、
以下の方式で解決させていただきました。

$reg=[regex]'([1-9])0000*([1-9][0-9]*)'
$reg.Replace($str,'$1-$2',1)

また、上記の案以外もこんな解決方法があるのかととても勉強になりました。
そして自分が要件をまとめられてなかったことにも反省いたしました。

今後はこちらで回答する側になれるよう、再度勉強いたします。
重ね重ね本当にありがとうございました。
530
(1): デフォルトの名無しさん [sage] 2022/09/14(水) 19:57:00.91 ID:b2aEm1i9(1) AAS
回答にある正規表現は置換回数を指定できない置換方法でも大丈夫
置換回数に1を指定する方法でやるなら単に ([1-9])0000*([1-9]) でもいい
531: デフォルトの名無しさん [sage] 2022/09/14(水) 22:22:31.78 ID:+0SwTq6N(2/2) AAS
>530
確かに、教えていただいたこともりもりにしてしまいましたが
わざわざ[1-9]のあとに[0-9]を入れている意味がないですね…。
ご指摘ありがとうございます。
532
(1): デフォルトの名無しさん [] 2022/09/18(日) 12:56:41.18 ID:QaJ1iFM2(1) AAS
githubで結構探したんですがそれっぽいのが見つからず、お力お貸しください。

●Regular Expressionの使用環境
AutoHotKey1.1系

●検索か置換か?
置換

●説明
2つのクォーテーションマークに囲まれたパスのうち、1つ目(app.exe)を削除したい。
囲まれたパス同士は半角スペースで接続される。

●対象データ
"D:\Dir_Path\_app.exe" "D:\Dir_Path\_script.ahk"
^^^^^^^^^^^^^^^^^^^^^^^

●希望する結果
"D:\Dir_Path\_script.ahk"
533
(1): デフォルトの名無しさん [sage] 2022/09/18(日) 16:16:05.56 ID:wjpqonb4(1) AAS
>>532
https://regex101.com/r/zxuEpo/1
534: デフォルトの名無しさん [] 2022/09/18(日) 19:20:15.15 ID:/uA/jgNo(1) AAS
>>533
ありがとうございますめちゃくちゃシンプルでした!あとこのregexサービスいいですね

".*"\s だと構文エラー吐きました
置換関数内(””の中)で”がうまく扱えないので頑張ってみます。
535
(1): デフォルトの名無しさん [sage] 2022/09/18(日) 21:26:30.42 ID:CbZe8FP4(1) AAS
"を
\"

\x22
に置き換えて試してみてわ
536: デフォルトの名無しさん [] 2022/09/19(月) 16:41:30.36 ID:4iw9Mtek(1) AAS
>>535
ありがとうございます、いけました
(ついでに””も削除)
\x22.*\x22\s|\x22
537: デフォルトの名無しさん [sage] 2022/09/20(火) 02:58:09.09 ID:94I1wBUa(1) AAS
二重引用符のエスケープは重ねて""だな
"".*""\s
538
(1): デフォルトの名無しさん [sage] 2022/10/29(土) 13:09:46.30 ID:ec13kmtS(1/2) AAS
●Regular Expressionの使用環境
PCRE2

●検索か置換か?
検索

●説明
(..[\0@-g]\0){147}などを高速に検索したい

●対象データ
メガ単位のバイナリファイル(リトルエンディアン)

●希望する結果
説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で
一定範囲だが不明な32bit値(0または0x00400000〜0x00670000付近)を含むブロック位置を列挙したいです

現状PCRE2で検索は出来ていますが、Intel Hyperscanだと
util/determinise.h:determinise:162:succ_id 16383 >= state_limit 16383
ng_mcclellan.cpp:buildMcClellan:590:state limit exceeded
rose_build_add.cpp:addOutfix:1779:could not build as either an NFA or a DFA
ng.cpp:addGraph:507:could not compile component 0 with 592 vertices
と言われて説明の例に限っては正規表現のコンパイルすら不可能です

32bit値は4バイト境界に限りませんが、ブロック先頭は4バイト境界なのでそこから高速化したいのですが
「(?>....)*?\K」を接頭しようとするとPCRE2_ANCHOREDはJITで使えませんし、そもそも遅くなるようです
今のところプログラム側でオフセットが4バイト境界のみを拾い、次の検索開始もアライメントしています
コールアウトもお察し…こういったパターンに適した書き方、又はCライブラリが有れば教えて欲しいです
539
(1): デフォルトの名無しさん [sage] 2022/10/29(土) 19:31:13.26 ID:9Ey1MUJ8(1) AAS
>>538
\0@って何?
\c@でNULL文字検索の意味ではないの?
540: デフォルトの名無しさん [sage] 2022/10/29(土) 19:42:35.80 ID:ec13kmtS(2/2) AAS
>>539
文字クラス[\0@-g]なので表記を統一するなら[\x00\x40-\x67]になります
541
(2): デフォルトの名無しさん [sage] 2022/10/30(日) 10:24:48.15 ID:dZd+t5oq(1) AAS
スプレッドシートで20221030と入力されている数字を日付の表記?2022/10/30なのか10/30/2022なのかわからないけどDATEDIF関数に使える形に置換する正規表現ってどう書きますでしょうか
542
(1): デフォルトの名無しさん [sage] 2022/10/30(日) 11:55:42.97 ID:oF72FRjI(1) AAS
>>541
正規表現では無理。スレチ
DATE関数で日付にかDATEVALUE関数でシリアル値に変換
セルA1の値:20221030
=DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2))
=DATEDIF(DATE(LEFT(A1,4),MID(A1,5,2),RIGHT(A1,2)),"2022/11/01","D")
543: デフォルトの名無しさん [sage] 2022/10/30(日) 12:28:15.07 ID:S1PTRz+V(1) AAS
>>541
=DATEVALUE(REGEXREPLACE(A1, "^(....)(..)(..)$", "$1/$2/$3"))

>>542
スレチ
1-
あと 459 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.027s