[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1(4): 2021/11/03(水)19:50 ID:ebAE+z9+(1/4) AAS
Regular Expressionスレです。
質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。
前スレ
Regular Expression(正規表現) Part15
2chスレ:tech
次スレは>>980宜しく
天ぷら等>>2以降
2(4): 2021/11/03(水)19:51 ID:ebAE+z9+(2/4) AAS
スルーされにくい質問のテンプレと例
●Regular Expressionの使用環境
Java1.5
●検索か置換か?
検索
●説明
各行の1番目のAまでを検索したい
●対象データ
ABCA
BCAA
CABA
●希望する結果
ABCA
^
BCAA
^^^
CABA
^^
※ ^ はアンダーラインだそうな ^^;
3(1): 2021/11/03(水)19:51 ID:ebAE+z9+(3/4) AAS
◆関連サイト
正規表現メモ
外部リンク[html]:www.kt.rim.or.jp
Perl正規表現雑技
外部リンク[htm]:www.din.or.jp
詳説 正規表現
外部リンク:www.oreilly.co.jp
正規表現クックブック
外部リンク:www.oreilly.co.jp
正規表現プログラミングFAQ
外部リンク[html]:capslockabcjp.kitunebi.com
.NET Framework の正規表現 | Microsoft Docs
外部リンク:docs.microsoft.com
正規表現 - JavaScript | MDN
外部リンク:developer.mozilla.org
鬼車
外部リンク:github.com
鬼雲
外部リンク:github.com
bregonig.dll(鬼雲の正規表現をサクラエディタ等で使用するためのライブラリ)
外部リンク[html]:k-takata.o.oo7.jp
Boost.Regex 1.45.0 (日本語訳)
外部リンク[pdf]:alpha.sourceforge.jp
秀丸: 複数行にまたがる検索について
外部リンク[html]:homepage2.nifty.com
サクラエディタ: 改行
外部リンク:d.hatena.ne.jp
※ サクラエディタでは複数行に渡る検索・置換は出来ません。
4: 2021/11/03(水)19:54 ID:ebAE+z9+(4/4) AAS
正規表現技術入門
外部リンク:gihyo.jp
↑の著者の一人であり Onigmo(鬼雲)やbregonig.dll の作者でもあるtakata先生のツイとQiitaの記事
Twitterリンク:k_takata
鬼雲に非包含オペレータを実装した話
外部リンク:qiita.com
Twitterリンク:5chan_nel (5ch newer account)
5: 2021/11/03(水)20:59 ID:554LNcID(1) AAS
>>1
スレ立てありがとう
ところで、C++コンパイラごとにbasic_regex::replace()の置換後文字列のバックスラッシュがエスケープされたりされなかったりするのが厄介ですね
6: 2021/11/03(水)21:43 ID:K+2zXBgv(1) AAS
外部リンク[htm]:troutlurefishing.jp
外部リンク[html]:murashun.jp
外部リンク[html]:www.itmedia.co.jp
7: 2021/11/04(木)11:16 ID:JyTL4wpj(1) AAS
nifty の URL 死んでるな
8: 2021/11/04(木)11:42 ID:diIHvWke(1/2) AAS
DeNAが個人ブログから正規表現の表丸パクりしてたのワロタ
9(1): 2021/11/04(木)11:59 ID:iRkMc3Gk(1) AAS
丸パクリならまだいい
改変もまともにできないのはヤバい
正規表現の例 マッチする例
Coo+el Coopel
画像リンク[jpg]:pbs.twimg.com
10(2): 2021/11/04(木)12:31 ID:B00ATyI8(1/2) AAS
>>9
どゆこと?
11(1): 2021/11/04(木)12:38 ID:Gz31zHb0(1) AAS
>>10
oの1回以上の繰り返しじゃ
pにマッチするわけないです
12: 2021/11/04(木)12:48 ID:diIHvWke(2/2) AAS
元がgoogleを例にしてたからこうなったのかな
いずれにしてもワロタ
13: 2021/11/04(木)12:49 ID:iCxb5Ekd(1) AAS
>>10
外部リンク:regex101.com
14: 2021/11/04(木)14:21 ID:B00ATyI8(2/2) AAS
>>11
ああ、勝手に.入れてた
ほんとだひどいな
15: 2021/11/04(木)14:53 ID:/D1z+6Mc(1) AAS
劣化コピーだから責められてて
上品だったら叩けない訳か
16: 2021/11/05(金)08:20 ID:+Hevqd/d(1) AAS
本歌取りと言う言葉もありますし
17: 2021/11/05(金)11:40 ID:pLniUbgZ(1) AAS
オマージュ・インスパイア→胡散臭い
本歌取り→凄そう
18: 2021/11/05(金)12:37 ID:1iAtfRIf(1) AAS
本歌取りに良いイメージがあるのは、この行為が和歌の世界で伝統的に許されてきたからだ。
19(1): 2021/11/06(土)20:39 ID:oKHbtIv+(1) AAS
祝☆ vim 3o+年
20: 2021/11/06(土)21:18 ID:G8Zn1Puj(1) AAS
>>19
スレ違い
21: 2021/11/07(日)00:36 ID:kpV1ZjX8(1) AAS
(/(>>1)/,'$1乙')
22: 2021/11/15(月)00:01 ID:5vPB6h42(1/2) AAS
今までに無いかつら、非包含オペレータ
外部リンク:bokete.jp
23: 2021/11/15(月)10:09 ID:xJpmlO5M(1) AAS
vimで文字列処理ってマイナーなのか?
UIでマッチをハイライトしながらパターンを書けるし、書いたパターンと処理はperlやsedのようにコマンドライン引数で渡してシェルスクリプトに組み込める(UI無し、非インタラクティブモード)
vimはバッファするからストリーム処理には向かないくて、パイプにはperlを使うけど、バッチ処理ならvimの方が速い
あと、個人的にアサーションの記法(\@<=等)も、()が深くなりがちなperl系の(?<=等)より好みだ
24: 2021/11/15(月)10:57 ID:Y0jbpZIM(1) AAS
惜しむらくは、マッチ後の単純でない処理を委託するvimscriptがクソなところだと思う、regex自体は十分パワフル
perlは任意のロジックをperl式に移譲するのが楽、パターンにも書けるし、大抵インラインで済む
vim9で大幅に言語変えるっぽいけど、どうなるやら
25: 2021/11/15(月)11:19 ID:vc2enCPn(1) AAS
()が減るケースって実用的にはあまり無いんじゃないか?アサーションの修飾対象がグループなら、どうせ()が必要になるわけだし
アサーションの\@が後置なのはperl系より一貫性があって良い設計だと思う、?,+,* etcと同列の修飾子とみなせる
26: 2021/11/15(月)21:36 ID:5vPB6h42(2/2) AAS
非包含オペレータの提案者の方の過去ログ漁ってたらすごいの出てきた
外部リンク[pdf]:www.a-k-r.org
これを使えば2次元の彼女が見つかりそう
27(1): 2021/11/17(水)00:30 ID:pGjzwEdG(1/3) AAS
AA省
28(1): 2021/11/17(水)00:32 ID:pGjzwEdG(2/3) AAS
上記で、分かりにくくてすみません、
>1:・ー└等の1文字と、半角スペース3つ以上のいずれかで文字列を分解したい
この「1:」は気にしないでください。
また、re.subで上手く行ったのは、1つめに書いた [・ー└]|( ){3,} です
29(16): 2021/11/17(水)01:31 ID:vtK5EVRE(1/3) AAS
AA省
30: 2021/11/17(水)02:52 ID:CiQU0O+7(1) AAS
( → (?:
31: 2021/11/17(水)04:06 ID:PbEjqT95(1) AAS
>>29
そもそも単文字なんだしグループにする必要なくね?
32: 2021/11/17(水)09:04 ID:GPq3lXDW(1/2) AAS
AA省
33: 2021/11/17(水)10:12 ID:A6BSd3Zu(1/2) AAS
正規表現に生の半角スペース使うのは一見気づきにくくて余り好きじゃないなぁ
\x20 にしない人多いのかな
34: 2021/11/17(水)10:36 ID:6wJ0temu(1/3) AAS
俺は生派
\sを使う人もいるけど俺は嫌
35: 2021/11/17(水)10:39 ID:GPq3lXDW(2/2) AAS
エディタの設定で可視化もできるしね。>半角スペース
36: 2021/11/17(水)10:39 ID:6wJ0temu(2/3) AAS
this is a pen
を
this\x20is\x20a\x20pen
とかも嫌
37(1): 2021/11/17(水)10:56 ID:A6BSd3Zu(2/2) AAS
文章になってるものまで生で使わないと言うわけじゃないけどな
ブラケットの中で使う場合なんかは生は避けたいわ
[ ]とかよく見かけるけど、分かりづらい
なお、\sは半角スペースを含むけどそれ自体じゃないので普通は区別して使うでしょ
38: 29 2021/11/17(水)11:01 ID:vtK5EVRE(2/3) AAS
this[ ]is[ ]a[ ]pen
proxomitronのフィルタ職人をやってるときはこうやってた
今だと this\ is\ a\ pen かな? 使ったことないけどw
\s は環境によっては全角スぺにマッチするから気を付けないとね
39: 2021/11/17(水)11:32 ID:6wJ0temu(3/3) AAS
>>37
エディタ上でははっきりと区別がつくけど
こんな所へ貼る場合は確かに分かり難いね
まあこの場合は目的が分かってるので分かりやすいとも言えるけど
40: 2021/11/17(水)20:33 ID:vtK5EVRE(3/3) AAS
Jane用の正規表現を掲示板に貼るときにはタブ文字のところを 【tab】 って
書き換えて貼ってたなぁ、しかしJane自体が廃れて使うことが無くなった
41(1): 27 2021/11/17(水)23:51 ID:pGjzwEdG(3/3) AAS
27です
こんなにも早く教えてくださってとても助かりました!
()が要らなかったんですね。勉強になります!
ありがとうございました!
42(2): 29 2021/11/19(金)20:58 ID:rZqXBgxj(1/2) AAS
これの検証してみた
Absence operator is broken #150
外部リンク:github.com
・検証コード (ruby 3.0.2p107 (2021-07-07 revision 0db68f0233) [x64-mingw32])
p /(?~a.*[bv].*c)/.match("000a111v222c333b444c555")
・結果
#<MatchData "000a111v222c333b444">
a〜v〜c を含んでしまってるのでバグで確定
原因は最初にマッチした段階で検索を打ち切ってしまっていて
別のパターンを見逃している
別のパターンを見つける必要があることは非包含オペレータ提案者さんの論文で
図付きで説明されてるけどこれを見落としてしまったオチ?
直すには論文通りに実装すれば良いだけなので直せないことは無さそう
自分がプログラミング出来れば直したいけどミジンコなので手も足も出ず..
-------------------------------------------------------
>>41 おつー
43: 29 2021/11/19(金)23:35 ID:rZqXBgxj(2/2) AAS
ついでにもう1つだけ
Use of \K when the string to match after \K can be empty #152
外部リンク:github.com
これは \K を使ってゼロ幅マッチになった場合に次の検索開始位置が
予期せず1つ進んでしまう問題のようだ
gsubの仕様かなと思ったけど (?<=\w) と \w\K の2つが違う結果になるのは
違和感ある、\K での ゼロ幅マッチ後の pos を進まないようにすれば直りそう
takata先生の代わりにちゃちゃっと始末してくれるスーパーハカーさん募集
44: 29 2021/11/20(土)00:06 ID:dCkHZW0G(1/2) AAS
\K より前で文字を消費していない場合は pos は進まないようだ
/\K/ → pos進まず
/.\K/ → 予期せずpos進んでしまう
45(1): 2021/11/20(土)13:49 ID:S4adbGs3(1) AAS
>>42
イシュー150の起票者がオリジナルの鬼車作者さんやんけw
46: 29 2021/11/20(土)14:09 ID:dCkHZW0G(2/2) AAS
>>45 そうなんだよね、だから気になってた
-------------------------------------------------
>>42 とは別の検証をしてみた
p /(?~a.*b.*c|222)/.match("000a111b222c333")
#<MatchData "000a111b22">
これは期待通りにマッチした、これが正しく動くということは
論文の読み落としではないね、失礼しました
問題は同一posでマッチ文字数が最短になるマッチを見つけなければいけないが
それをしていないことみたいだ
この処理って結構な処理量になりそうだけど大丈夫なのかな?
オペレータ提案者さんのサンプルコードではどうなってるんだろ?
プログラムが読めないから対応出来てるのか分からない..
あまりに重いようなら量指定子を使えるようにしたほうが良いかもしれない
.* を .{0,1000} に書き換えて処理量を限定させるのと同じで
(?~abc){0,1000} みたいな指定が出来るようにすれば..
47(1): 29 2021/11/25(木)18:40 ID:QsU6pq8j(1/2) AAS
Onigmo のバグの原因となった個所が判明したので書いておこう
正規表現における非包含オペレータの提案
外部リンク[pdf]:staff.aist.go.jp
この論文のサンプルコードに下記のメソッドがある
def try_alt(r1, r2, str, pos, &block)
try(r1, str, pos, &block)
try(r2, str, pos, &block)
end
これは正規表現で言うと r1|r2 の "|" にあたる動作をする部分のメソッドだが
このサンプルコードでは r1 のマッチが成功した後でも必ず r2 を試す仕様になっている
しかし Onigmo の検索方式では r1 がマッチした後に正規表現の最後までマッチが
成立した場合には r2 が試されない仕様になっている
これにより r2 を通る一部パターンが見落とされる結果となりバグとして出現した
論文中の非包含オペレータのメソッドである def try_absent(r, str, pos) は
上記の def try_alt を使う前提で書かれたものなのでこれをそのまま Onigmo には移植出来ない
サンプルコード方式での処理量を考えるとおそらくこれとはまったく別のアルゴリズムで動く
動作の軽いメソッドを自作しないと Onigmo には導入出来ないのではないだろうか..
48: 29 2021/11/25(木)19:06 ID:QsU6pq8j(2/2) AAS
論文3ページ目の右半分に 表3 がある
r1r2 | [:seq, r1, r2]
ここの :seq は r1 と r2 を連接するという意味で使われているが
サンプルコードでは :seq を使わず :cat になっている
ここで疑問なのが何故違う名前を使うことになったのか? である
(仮説1) 非包含オペレータ提案者さんは猫が好き
ごろにゃんしながらバックトラックにゃん である
(仮説2) cat は Unix でよく使われる連結コマンドであり catenate から由来する
これもなかなかの難問である
49(1): 2021/11/29(月)20:58 ID:ZJywLyaD(1/3) AAS
ある短い英単語が文章に含まれているかどうかを判定したいのですが、
他の英単語の一部に含まれているようなときは除外したいです。
例:検索単語:ap、
○:ap is short of...
○:これはapです
NG:pen pineapple apple pen
つまり、『単語の前後に文字がある場合は、それらがアルファベットでない』という条件を加えたいのですが、
これの実現方法に詰まっています。
[^a-zA-Z]ap[^a-zA-Z]
の至るところに、.*や*や+を様々なパターン試したのですがうまく行かず。。。
うまく行ったと思っても、指定単語が文頭や文末に来て、前後のどちらかに文字がないときはうまく行きません。
どなたかご教授頂けませんでしょうか。
50: 2021/11/29(月)21:09 ID:be+dUloq(1/2) AAS
>>49
(?<![a-zA-Z])ap(?![a-zA-Z])
もし英文のみなら
\bap\b
でも可
51: 2021/11/29(月)21:22 ID:ZJywLyaD(2/3) AAS
こんなに早く教えていただいてありがとうございます。
試してみたのですが、うまく行きませんでした。検証方法間違ってますでしょうか?
----------------
value="abc ap abc"
pattern = "(?<![a-zA-Z])ap(?![a-zA-Z])"
re.match(pattern, value)
※何も取得できず
----------------
52(1): 2021/11/29(月)21:35 ID:7mT4ej7+(1) AAS
re.matchじゃなくてre.search
matchは先頭位置からしかマッチするか調べない
53(1): 2021/11/29(月)21:41 ID:be+dUloq(2/2) AAS
ところで
ap'sとかap-dataとかもろもろの扱いはいいのか?
54: 2021/11/29(月)22:02 ID:ZJywLyaD(3/3) AAS
>>52
ありがとうございます!うまく行きました!
大変初歩的な間違い、失礼いたしました。。。ご助言ありがとうございます
>>53
ご指摘ありがとうございます。そこの考慮をしていませんでした。
今回はたまたま問題ありませんでしたが、これからは考えます。
ありがとうございました。
55: 29 2021/12/06(月)21:53 ID:S5ugmQVz(1) AAS
rubyのコードが読めたから調子に乗って鬼車のソースからのインストールと
simple.c の実行に挑戦してみたら成功するまで10日くらいかかった
win10 パソコンで VMware を動かして中に ubuntu 20.04 を入れて
oniguruma 6.9.7 をインストした
あとは C言語で書かれたサンプルコードを解析すれば oniguruma の
色々なオプションを試せるようになる..
Unix も C言語 も知らないしプログラマでもないミジンコだけどググりまくれば
意外と何とかなりそうだ、次は Onigmo を入れよう..
56(1): 29 2021/12/07(火)02:27 ID:gbEOg3vj(1/3) AAS
Onigmo もインスト出来たけど simple.c の実行結果がおかしい
// oniguruma の場合
match at 4
0: (4-14)
1: (5-13)
// Onigmo の場合
match at 4
0: (21474836484-55834574862)
1: (0-0)
インスト失敗か?
README_japanese に書いてある "onig-config --cflags" での構成確認は
oniguruma と Onigmo で同じコマンドだけど共通のコマンドなのかな?
両方入れたからどっちの構成を確認してるのか分からない
57: 29 2021/12/07(火)04:28 ID:gbEOg3vj(2/3) AAS
↑の構成確認の件はOnigmo の README.ja の 111 〜 114 行目 が
oniguruma の説明のままなだけだった、takata先生更新を..
.ja が付いてない英語版も同様です
github の Onigmo のトップページでは正しく
"onigmo-config --cflags" と書いてありました
58: 29 2021/12/07(火)15:13 ID:gbEOg3vj(3/3) AAS
↑ の件ですが README.ja の 61 行目の
> 以下、鬼車の README.ja:
を見落としておりました、鬼車の説明書きのコピペだったのね..orz
>>56 の Onigmo の結果がおかしかったのも↓で正常動作しました
間違い: cc sample.c -L/usr/local/lib -lonig
正しい: cc sample.c -L/usr/local/lib -lonigmo
お騒がせして申し訳ありません m(__)m
59: 29 2021/12/14(火)23:52 ID:hRBVXs3o(1) AAS
perl5と鬼車、鬼雲の動作を比べて遊んでたらperl5の変な挙動を発見
\d{1} の {1} を付けるか消すかで結果が変わる
---------------------------
my $str = '12';
$str =~ s/(?<name>\d{1}){0}(?&name)/<match=$&>/;
print "$str\r\n";
---------------------------
↓{0} での定義を (?(DEFINE) ... ) に変えると正常動作する
---------------------------
my $str = '12';
$str =~ s/(?(DEFINE)(?<name>\d{1}))(?&name)/<match=$&>/;
print "$str\r\n";
---------------------------
perl 5, version 32, subversion 1 (v5.32.1) built for MSWin32-x64-multi-thread
60: 29 2021/12/15(水)05:01 ID:+lf8SrwJ(1) AAS
・ {0} での定義ではマッチせず
---------------------------
my $str = '123';
$str =~ s/(?<name>123){0}(?&name)/<match=$&>/;
print "$str\r\n";
・DEFINEを使うと正常動作する
---------------------------
my $str = '123';
$str =~ s/(?(DEFINE)(?<name>123))(?&name)/<match=$&>/;
print "$str\r\n";
---------------------------
perl5 では {0} で定義するのは想定外?
61(1): 29 2021/12/16(木)22:14 ID:0VSoy2O4(1) AAS
onigurumaの非包含オペレータの動作が論文と違う
正規表現 ^(?~abc) をテキスト 0123abcd に対して検索して比較すると..
論文の動作 : 0123ab がマッチする
onigurumaの動作 : 0123 がマッチする
逆に Onigmo は分岐が含まれない正規表現なら論文通りに動作するので
この場合は論文と同じ動作をする
動作的には ((?!abc).)* と同じなので論文で指摘されているように
形式言語理論から逸脱しているし、後ろに続く正規表現によっては
マッチ出来ずに検索が終わってしまうケースが発生する 例、 ^(?~abc)c
非包含オペレータは提案から14年経ってもなお未完のままということに..
62(1): 2021/12/17(金)13:32 ID:N/8v4GiQ(1) AAS
>>61
^(?~(?<=ab)c)
63(1): 2021/12/17(金)15:12 ID:wvP9ttxM(1) AAS
記号が同じなだけで名称も説明上の動作も違うからそもそも似て非なる別物
ではなくて?
64: 29 2021/12/17(金)19:59 ID:t+q3CK3B(1) AAS
>>62 それ反則w ちなみにこんなのもある
Perl正規表現雑技 : ある文字列を含まないものにマッチする正規表現
外部リンク[htm]:www.din.or.jp
>>63 その解釈で間違ってないと思う、oniguruma の (?~abc) は仕様が
決まった時点で別物だね、(?:(?!abc).)* の拡張版と言ったほうがしっくりくる
実用上は oniguruma 版のほうが使いやすそうだしあえて変えたんだろうね
65: 2021/12/17(金)20:49 ID:BDVQn7Pa(1) AAS
いやぁ、、ヒネくれちゃっただけでしょ
66: 2021/12/19(日)06:09 ID:X6k+U6Sv(1) AAS
成果だけ横から頂いてこっちで改変流用するわwおまえ除名なwとか言われちゃったらまあ拗ねもするさ
67: 2021/12/19(日)08:57 ID:hMGijQ8S(1) AAS
(?s:^(?=.*(?:トビラ|280|280|[内外]製|純正|公式))(?=.*(?:ガイジ|発狂|長文|必死|キチガイ|キチキチ)))
これが効かないんすけど何か間違えてますか?
2chスレ:android
68: 2021/12/19(日)10:54 ID:mCvaVjB9(1) AAS
少なくともchmateだとマッチしてる
正規表現と文字列の切り替えの設定間違えてるんじゃないの
69(1): 2021/12/20(月)20:18 ID:k8SAGnLj(1/6) AAS
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
IPv4アドレスに一致させたい
●対象データ
2021.12.19.06
192.168.1.1
●希望する結果
192.168.1.1
下の正規表現だと2021.12.19.06の021.12.19.06に一致していまいました。
/(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/k
70: 69 2021/12/20(月)20:22 ID:k8SAGnLj(2/6) AAS
すみません
対象データの訂正です
最初と最後に文字列があります
●対象データ
AB2021.12.19.06E
CD192.168.1.1E
71: 2021/12/20(月)20:25 ID:cLNhpahP(1/2) AAS
外部リンク:www.google.co.jp
72(9): 2021/12/20(月)20:55 ID:k8SAGnLj(3/6) AAS
度々すみません
訂正があったので再度質問させてください
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
IPv4アドレスに一致させたい
条件
前後に何も含まない場合
前後に[]を含む場合
前後に半角を含む場合
●対象データ
A2021.12.19.06B
B192.168.1.01B
192.168.1.1
[192.168.1.1]
_192.168.1.1_ ←_は半角空白
●希望する結果
192.168.1.1
[192.168.1.1]
_192.168.1.1_ ←_は半角空白
下の正規表現だと2021.12.19.06の021.12.19.06に一致していまいました。
/(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)/k
よろしくお願いします
73: 72 2021/12/20(月)21:00 ID:k8SAGnLj(4/6) AAS
希望する結果では[]や半角を含まずIP部分だけ一致させたいです
よろしくお願いします
74(4): 2021/12/20(月)21:13 ID:cLNhpahP(2/2) AAS
(?<![.0-9])(IPv4の正規表現ggrks)(?![.0-9])
75: 72 2021/12/20(月)21:27 ID:k8SAGnLj(5/6) AAS
>>74
ありがとうございます
それだとIPv4アドレスではない部分に一致してしまいダメ
(?<![.0-9])([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3})(?![.0-9])
76: 72 2021/12/20(月)21:31 ID:k8SAGnLj(6/6) AAS
>>74
こういった結果を希望しています
よろしくお願いします
●対象データ
A2021.12.19.06B
B192.168.1.01B
192.168.1.1
[192.168.1.1]
_192.168.1.1_ ←_は半角空白
●希望する結果
一致しない
一致しない ←.01という表記が正しくない為
192.168.1.1 ←一致
192.168.1.1 ←[]の中を一致
192.168.1.1 ←前後の半角を除いて一致
77: 2021/12/20(月)21:50 ID:k8/KZn4u(1) AAS
[192.168.1.1_
78: 72 2021/12/20(月)22:36 ID:azxFC8Fx(1) AAS
>>74
下の通りにしたら出来ました
ありがとうございました
/(?<![.0-9])(((25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9][0-9]|[1-9]?[0-9]))(?![.0-9])/k
79(3): 2021/12/21(火)05:04 ID:DlXpRfUq(1) AAS
(?<![.\d])(?:(2(?:5[0-5]|[0-4]\d)|1\d\d|[1-9]?\d)\.){3}\g'1'(?![.\d])
80: 72 2021/12/21(火)12:15 ID:bLPLuUHJ(1/5) AAS
>>79
できました
ありがとうございました!
81(3): 2021/12/21(火)12:48 ID:YqPiCVQe(1) AAS
(?<![.\d])(25[0-5]|2[0-4]\d|1\d\d|[1-9]?\d)(?:\.\g'1'){3}(?![.\d])
82: 72 2021/12/21(火)12:54 ID:bLPLuUHJ(2/5) AAS
>>81
できました
ありがとうございます!
みなさん頭いいんですね・・・私は単純な正規表現しか分からず
83: 72 2021/12/21(火)13:04 ID:bLPLuUHJ(3/5) AAS
ちなみに>>79さんや>>81さんの正規表現だと
こういった正規表現チェッカーでは一致しないのは何故なんでしょうか?
外部リンク:www.debuggex.com
JavaScriptと表示されているリストをPythonに指定して試しました
84: 2021/12/21(火)16:35 ID:fKMzp4yd(1) AAS
後方参照の記法絡みかなあ
85: 2021/12/21(火)16:46 ID:ehDQ8UlO(1) AAS
¥をつかうか、$を使うかは、なかなか思い出せないから困る
86(3): 2021/12/21(火)18:31 ID:2Q9XRXAv(1) AAS
>>79 >>81
サクラエディタ(というか鬼車や鬼雲、bregonig.dllの正規表現)
の\dは全角数字にもマッチするから
[0-9]で検索すべき
全角が含まれてしまう話は\s,\wなども同様
サクラエディタBBSでの高田先生の過去発言
外部リンク[html]:sakura-editor.github.io
87: 72 2021/12/21(火)18:47 ID:bLPLuUHJ(4/5) AAS
>>86
なぜか分かりませんが全角には一致しなかったので大丈夫でした
88: 72 2021/12/21(火)18:54 ID:bLPLuUHJ(5/5) AAS
>>86
よく確認したら全角にも一致していました
すみません
89: 2021/12/21(火)19:19 ID:N0HCE/E4(1) AAS
左端に(?a)をつければ\dのままでも?
90: 2021/12/21(火)19:35 ID:aQSGSn8P(1) AAS
Meryの\dは半角のみ
正規表現まわり含め検索はサクラよりMeryのが良いな
サクラは複数行検索不可だし
91(11): 2021/12/21(火)20:39 ID:wzddSm6Q(1) AAS
●Regular Expressionの使用環境
サクラエディタ(bregoing.dll Ver4.20 with Onigmo 6.2.0)
●検索か置換か?
検索
●説明
IPv6アドレスに一致させたい
条件
●対象データ
2603:1096:0604:00bc:0000:0000:0000:0009
(2603:1096:0604:00bc:0000:0000:0000:0009) ←半角括弧の中だけに一致させたい
_2603:1096:0604:00bc:0000:0000:0000:0009_ ←_は半角スペースの中だけに一致させたい
2603:1096:604:bc::9
(2603:1096:604:bc::9)
_2603:1096:604:bc::9_
●希望する結果
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:604:bc::9
2603:1096:604:bc::9
2603:1096:604:bc::9
○試した正規表現
下の正規表現だと最後の:以降(上の例だと最後の9)が一致しませんでした
(\:\:([a-f0-9]{1,4}\:){0,6}?[a-f0-9]{0,4}|[a-f0-9]{1,4}(\:[a-f0-9]{1,4}){0,6}?\:\:|[a-f0-9]{1,4}(\:[a-f0-9]{1,4}){1,6}?\:\:([a-f0-9]{1,4}\:){1,6}?[a-f0-9]{1,4})(\/\d{1,3})?
よろしくお願いします
92: 2021/12/21(火)23:04 ID:lAwv+hLw(1) AAS
>>86
鬼車なら、オプション指定(?D)でdigitをASCIIだけにできる
(?D)..¥d..
93: 2021/12/22(水)00:48 ID:zQqayV78(1) AAS
正直\dを[0-9]以外にもマッチさせる仕様ってどういう時に便利なのか今一つ分からん
94(2): 2021/12/22(水)03:24 ID:dkzRMG/Q(1) AAS
[0-469bc:]++
95(1): 2021/12/22(水)09:44 ID:dK2CjfaN(1/2) AAS
住所にしろ日付にしろ上から順に書いた方が齟齬が生じないだろうに
西洋文化圏のやつらは何が何でも省略しなきゃ気が済まないんだろうな
こんなもん略記許さない仕様の方が逆に全体的な効率は良いだろうに
フロッピーディスクの時代なら少しでも容量減らしたいのは分からなくも無いけど
96(2): 91 2021/12/22(水)10:25 ID:giUFecUL(1/6) AAS
>>94
ありがとうございます
IPv6アドレス以外には一致させたくないのです
●対象データ
1
01
2603:1096:0604:00bc:0000:0000:0000:0009
(2603:1096:0604:00bc:0000:0000:0000:0009) ←半角括弧の中だけに一致させたい
_2603:1096:0604:00bc:0000:0000:0000:0009_ ←_は半角スペースの中だけに一致させたい
2603:1096:604:bc::9
(2603:1096:604:bc::9)
_2603:1096:604:bc::9_
●希望する結果
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:0604:00bc:0000:0000:0000:0009
2603:1096:604:bc::9
2603:1096:604:bc::9
2603:1096:604:bc::9
97: 2021/12/22(水)11:10 ID:j6Uulo2p(1) AAS
>>95
個人的な本名や住所が先頭に来るのは西洋文化圏というよりイスラム圏も含めた地中海世界
プログラミング言語だと名前空間が上から順で統一されてるのに不思議だよね
98(1): 2021/12/22(水)11:53 ID:dK2CjfaN(2/2) AAS
>>96
>>74と同じ手法でやればいいじゃない
99(1): 91 2021/12/22(水)12:01 ID:giUFecUL(2/6) AAS
>>98
ありがとうございます
どういうことでしょうか?例えば>>94さんの例を元にして下の通りにしてもIPv6以外に一致してしまいます
(?<![.0-9])([0-469bc:]++)(?![.0-9])
100: 2021/12/22(水)16:45 ID:rmiXIWtW(1) AAS
IP アドレスの正規表現ぐらい、公式が発表しているのでは?
101(1): 2021/12/22(水)17:23 ID:Q/8wGtmi(1/3) AAS
>>99
最小がわからんので{8,}は適当だが、例文の限りではこれでいける。
ちょいと調べたら16進数とのことなので0-9,a-fなんでないの?
[0-9a-f:]{8,}
102: 2021/12/22(水)17:29 ID:SKIY34Ty(1) AAS
IPv6を正確に捕捉するのは難しいだろ
2001:db8:0:0:1::1は×で、2001:db8::1:0:0:1が正しい
::ffff:c000:0280 = ::ffff:192.0.2.128
2001:db8:a::123/64
fe80::3%1
103(1): 91 2021/12/22(水)17:33 ID:giUFecUL(3/6) AAS
>>101
ありがとうございます
それだと16:54:09みたいな日付にも一致してしまいました
104(1): 2021/12/22(水)17:41 ID:Q/8wGtmi(2/3) AAS
>>103
そのパターン限定なら{8,}を{15,}とかで回避できる
105(1): 91 2021/12/22(水)17:52 ID:giUFecUL(4/6) AAS
>>104
ありがとうございます
{9,}にしたら出来ました!
ちなみにこういうものに一致しないようにする方法はありますか?
:2603:1096:604:bc::9 ←先頭に:がある
こういう出現はないはずなんですが、もし簡単な正規表現の追加で出来たら嬉しいなあと
106: 91 2021/12/22(水)17:58 ID:giUFecUL(5/6) AAS
>>105
出来た・・・と思ったんですが、文字数の調整で対応できない数字や英字の連続に一致してしまいダメでした
107(1): 2021/12/22(水)18:06 ID:Q/8wGtmi(3/3) AAS
これでどう?
ただし頭:への対応は無理
([0-9a-f:]+:){4,}[0-9a-f]+
108(4): 91 2021/12/22(水)18:17 ID:giUFecUL(6/6) AAS
>>107
度々ありがとうございます
それでも数字や英字の連続に一致してしまいダメでした
08d9c24701be
合ってるか分からないのですが、今のところ>>91の正規表現の末尾に[0-9]*を加えています・・・
(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))[0-9]*
109: 2021/12/22(水)18:29 ID:G1M4O4Y+(1) AAS
>>108
ところどころfe80とかffffみたいにベタ書きしてるのはなぜ?
110: 2021/12/22(水)21:01 ID:++/G/dKU(1) AAS
忘年会ネタにどうぞ
外部リンク[txt]:github.com
外部リンク[txt]:github.com
111(1): 2021/12/23(木)03:07 ID:0XYH//o1(1) AAS
(?<!\h)(IPv6の正規表現ググレカス)(?!\h)
112(1): 2021/12/23(木)09:13 ID:fgU7IqZ3(1/3) AAS
>>108
>08d9c24701be
([0-9a-f:]+:){4,}[0-9a-f]+
俺の環境ではマッチしないし、しないはずだけど?
113(2): 2021/12/23(木)09:14 ID:fgU7IqZ3(2/3) AAS
>>108
ちなみにipv6の正規表現で検索して色々出てきたけど、下のやつから頭とお尻の(^$)とるとマッチするんだが、改行が含まれてしまう。
他は>>96がイレギュラーすぎてマッチしないのが多い。
外部リンク[html]:tech-uh-oh.blogspot.com
114(1): 91 2021/12/23(木)12:05 ID:czwrZ62f(1/4) AAS
>>111
ありがとうございます
IPv6の正規表現も含めて教えてほしいです
>>112
ありがとうございます
すみません、もう一度試したところ08d9c24701beには一致しませんでした
これは対象データと希望する結果に書き忘れていたのですが、
教えてもらった([0-9a-f:]+:){4,}[0-9a-f]+だと2002:a05:622a:15cc::に一致しませんでした
115: 91 2021/12/23(木)12:10 ID:czwrZ62f(2/4) AAS
>>113
度々ありがとうございます
そのURLにある正規表現だと長すぎてサクラエディタに登録できませんでした
116(1): 2021/12/23(木)12:30 ID:fgU7IqZ3(3/3) AAS
>>114
([0-9a-f:]+:){4,}[0-9a-f:]+にすれば、それもマッチするけど
また要らないがマッチする可能性も出てくる。
117: 91 2021/12/23(木)12:52 ID:czwrZ62f(3/4) AAS
>>116
何度もありがとうございます
1つの正規表現にまとめることにこだわらずに、
>>116で教えてもらったものと>>108の2つで対応したいと思います
どうもありがとうございました
>>108だと以下のようなものが一致せず困っていたので・・・
2001:db8::1:0:0:1
2001:db8::0:1:0:0:1
2001:0db8::1:0:0:1
118(1): 2021/12/23(木)18:54 ID:vyeaRFwP(1/2) AAS
(?<![\h:])(?:(\h{1,4}:)(?:(:\h{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:\h{1,4}|:))(?![\h:])
119: 91 2021/12/23(木)18:57 ID:czwrZ62f(4/4) AAS
>>118
わたし宛でしょうか?
それを試したら何にも一致しませんでした・・・
120: 2021/12/23(木)20:41 ID:XObIp/CD(1) AAS
>>113
\sに改行が含まれるからでしょ
Rubyとかなら0x09〜0x0D(水平タブHT,LF改行,垂直タブVT,改頁,CR改行)と0x20(スペース)
サクラエディタの鬼雲なら上記に加えて、
その他の改行種(NEL,PS,LS)や空白種(全角スペースやNBSPなど)
121: 2021/12/23(木)21:45 ID:vyeaRFwP(2/2) AAS
([0-9a-f]{1,4}:)(?:(:[0-9a-f]{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:[0-9a-f]{1,4}|:)
(?<![0-9a-f:])(?:([0-9a-f]{1,4}:)(?:(:[0-9a-f]{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:[0-9a-f]{1,4}|:))(?![0-9a-f:])
(?<![0-9a-f])(?:([0-9a-f]{1,4}:)(?:(:[0-9a-f]{1,4}){1,6}|:)|\g'1'{2}(?:\g'2'{1,5}|:)|\g'1'{3}(?:\g'2'{1,4}|:)|\g'1'{4}(?:\g'2'{1,3}|:)|\g'1'{5}(?:\g'2'{1,2}|:)|\g'1'{6}(?:\g'2'{1}|:)|\g'1'{7}(?:[0-9a-f]{1,4}|:))(?![0-9a-f:])
122: 2021/12/24(金)07:37 ID:MVBh4BeN(1) AAS
(([0-9a-f]{1,4}):){7}(?:\g'2'|:)|\g'1'{6}(?:(:\g'2')|:)|\g'1'{5}(?:\g'3'{1,2}|:)|\g'1'{4}(?:\g'3'{1,3}|:)|\g'1'{3}(?:\g'3'{1,4}|:)|\g'1'{2}(?:\g'3'{1,5}|:)|\g'1'(?:\g'3'{1,6}|:)
123(1): 2021/12/24(金)12:59 ID:OtUQWwNp(1) AAS
短くするの?
(([0-9a-f]{1,4}):){7}(\g'2'|:)|(\g'1'()|(?=\5)(?!\6):()){1,6}\g'2'?(?=\6)
124(1): 2021/12/24(金)15:17 ID:nz+3yICM(1) AAS
すげえw
()で文字間の位置をキャプチャ出来る事もそれを参照で先読みで使える事も知らなかったわ
125(3): 2021/12/24(金)16:07 ID:TnoL0oNz(1/2) AAS
>>124
ごめん、先読みにする必要なかった
(([0-9a-f]{1,4}):){7}(\g'2'|:)|(\g'1'()|\5(?!\6):()){1,6}\g'2'?\6
126(2): 2021/12/24(金)16:09 ID:TnoL0oNz(2/2) AAS
外部リンク:www.perlmonks.org
127: 2021/12/24(金)23:23 ID:zm3lCbTy(1) AAS
>>125
その表現だと↓みたいなポート番号にまで一致しちゃうYO!
2001:db8::1:80
これは表記がそもそも推奨されないからいいっちゃいいけど
上下前次1-新書関写板覧索設栞歴
あと 875 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.040s