Regular Expression(正規表現) Part17 (277レス)
1-

194
(1): 2024/09/12(木)16:55 ID:tplSlOtQ(1) AAS
>>187,193
dnGrepも良い

マッチ箇所の前後数行表示やマッチファイル全体プレビュー表示でサクッと探して
diffとtext editor用の外部コマンドラインを複数登録して使ってる
(有名どころのテンプレートあり)
195: 2024/09/12(木)17:00 ID:G9h42jpn(5/6) AAS
>>193
テキストエディタは何でも良いとは言ったけど
起動引数にファイル名と行位置を指定できるものじゃないと使い物にならない
メモ帳はダメだが大抵大丈夫
196
(1): 2024/09/12(木)17:38 ID:G9h42jpn(6/6) AAS
>>194
良さそうだなと思ったらwin7には無理っぽい(.NET8だとか)
197: 2024/09/13(金)06:32 ID:11vS+uA+(1) AAS
>>196
文字エンコーディング自動判別が出来るので、ちょっと古めのcp932とUTF8の混在環境で重宝すると思ったがそれは残念

>>183,193は大丈夫そうだけど(根拠なし)
198: 2024/09/23(月)23:23 ID:kDMCxsRj(1) AAS
pcre2の作者さんが後継者探してる
27年続けてきて最近年を感じるようになったとか
199
(1): 2024/09/26(木)08:21 ID:JQMFr7dw(1) AAS
老朽ソフトウェアの後継者問題って
需要があれば勝手にメンテされるし無ければ消えるだけだよ
正規表現は時代に合ってないからこの概念ごと消えるかもしれない
200: 2024/09/26(木)20:55 ID:DovoaZNg(1) AAS
>>199
正規表現が時代に合ってないってどういうこと?
201: 2024/09/26(木)22:02 ID:KgNEnM1+(1) AAS
たぶんだけど自然言語で書く、かな
いまでもコンパイルはしてるし
曖昧な表現だとランタイムエラーになるのはおなじ
202: 2024/09/26(木)22:22 ID:ingxpjLa(1) AAS
AIと喋ってろ
203
(2): 2024/09/29(日)08:05 ID:rL2U3h48(1) AAS
自然言語を聞いたAIが作るのが正規表現というオチ
既存の正規表現エンジン用の正規表現ではなくAIが生成した正規表現を動かすためだけの
正規表現エンジンも生成される
既存の正規表現エンジンと比べてデータサイズが小さく不要な機能が無いため高速に動作

64コアCPUでテキストデータの64ヶ所を同時に検索
正規表現がテキストにマッチしない場合の速さが2024年時点の通常検索の速さを超えてしまう

野良猫理論: ある限られた空間であちこちをうろつく複数の野良猫が置き餌を見つけるのに
かかる時間は頭数の二乗に反比例するような気がする理論
204: 2024/10/01(火)11:39 ID:Z3sXryIq(1) AAS
>>203
>野良猫理論:
なるほど、そうかも
205: 2024/10/01(火)11:45 ID:v9xyba12(1) AAS
>>203
妄想はAIとすれば捗るぞ
206: 2024/10/06(日)00:20 ID:YLpbtiCB(1) AAS
DFA 「NFA、僕は君のことをクリーネ閉方したい」
NFA 「受理できません」
207
(1): 2024/10/08(火)20:25 ID:2vPrSKyO(1) AAS
久しぶりにプログラム板にきました
あるwebサイトのたとえばx0000からx99999までのurl内それぞれ個別にあるたとえば日付等の項目を
すべてカンマ区切りで抜き出す正規表現を考えようとしましたが
結局、項目が10個まであるわけじゃないので
<!DOCTYPE.*ほにゃらら項目、ほにゃらら項目…ほにゃらら項目、ほにゃらら*</html>
てのを10まであるわけじゃない項目分それぞれ抜き出しました
本来なら、 項目,項目,項目…… で抜き出せるように一発で正規表現使えば何とかなるのでしょうけれど、
項目だけの列といいましょうかx0000の項目Aからx9999の項目Aをまずだして
次にx0000の項目Bからx9999の項目Bを次に出してと
結局その項目が10までとはいかないけれどその分をだして表計算ソフトにつっこんだわけです
結果できましたがどうにも納得がいきません

正規表現が出来ればきっとっとも楽に時間もかからずできたのでしょう

JaneXeno質問スレ9
2chスレ:software
いまこのスレにいたりもします。
208: 2024/10/08(火)22:03 ID:XPh9YV+I(1) AAS
>>207
1. まず日本語を整理する能力を身につけましょう
2. 次にテストケースを整理する能力を身につけましょう
3. そして1.と2.で身につけた能力を使ってChatGPTに問い合わせましょう

さすれば望む答えが楽に得られます
209: 2024/10/09(水)01:44 ID:WkCTujRI(1/2) AAS
ここは野良猫理論を数学的に証明するスレになりました
210: 2024/10/09(水)02:26 ID:LpRCWPua(1) AAS
すごく読み難いし目的も読み取れない
終わってる
211: 2024/10/09(水)03:04 ID:w53uZCE9(1) AAS
頑張って2回読んだけど何のアドバイスもできそうにない
212: 2024/10/09(水)05:04 ID:z5soGBkc(1) AAS
Excel VBA 質問スレ Part81
とやらにいる障害者みたいだね
213: 2024/10/09(水)09:59 ID:nVMNMgni(1) AAS
DOCTYPE全然関係なかったんやな
>>180がアタリ
>>179,181はハズレ
214: 2024/10/09(水)12:56 ID:WkCTujRI(2/2) AAS
とりあえずxenoをあぼーん登録しといた
215: 2024/10/10(木)13:27 ID:WHQFPCFe(1) AAS
そういえばこのスレが伸びたのも発端は>>120だったな
>>120みたいな難問を気軽に質問されたら困る
216
(1): 2024/10/12(土)15:23 ID:gMUOKJHq(1/2) AAS
●Regular Expressionの使用環境
VS Code 1.94.2 の検索バー

●検索か置換か?
置換

●説明
htmlファイルを開いている。
href属性が .css で終わらない場合に属性値を空文字列へ置換したい。
href="[^"]+(?!\.css)"を検索したが .css で終わっていてもマッチしてしまう。

●対象データ
<a href="URL.css">link</a>
<a href="a.html">link</a>
<link rel="stylesheet" href="a.css">
<link rel="stylesheet" href="b">

●希望する結果
<a href="URL.css">link</a>
<a href="">link</a>
<link rel="stylesheet" href="a.css">
<link rel="stylesheet" href="">
217
(1): >>216 2024/10/12(土)15:33 ID:gMUOKJHq(2/2) AAS
原理はよくわかりませんが自己解決しました
href="[^"]+(?<!\.css)"
218: 2024/10/12(土)16:13 ID:qxhXc26A(1/2) AAS
href="[^"]+(?!\.css)"

<a href="URL.css">link</a>で"[^"]+の最後の文字はs
つまりsの位置では.cssではないのでマッチする
219: 2024/10/12(土)16:15 ID:qxhXc26A(2/2) AAS
sの後ろ(つまり")の位置に訂正
220: 2024/10/12(土)17:58 ID:hwVWGPYm(1) AAS
正規表現関係ないけどhtmlタグ周りの操作は
できるだけDOM経由でやっておいたほうが楽で安全だと思う

htmlの書き方がみんな揃ってるとは限らないし
<div>href="foo"</div>とかlocation.href=“bar”にはマッチしないようにするとか
いろいろ考慮ポイントが増えてミスするリスクも高くなる

DOM経由でやっておけばその辺は安心
document.querySelectorAll("[href]:not([href$='.css'])").forEach(x=>x.setAttribute("href", ""))
221: 2024/10/13(日)15:34 ID:josLIOo8(1) AAS
>>217
それ大正解だよ、すごい
それ以上のものを作れと言われたら大抵の人は悩む
というか>>217の答えに辿り着けない人が多数かと
222: 2024/11/02(土)23:35 ID:5ILrPZJU(1) AAS
正規表現のオペレータの分類についての質問です
assertionにアンカーやバウンダリを含める分類はあまり見かけませんが何故でしょう?(例dotnet文書)

以下(多分regex界で著名な)参考サイトより引用
Assertions. The traditional regular expression metacharacters ^ and $ can be viewed as assertions about the text around them: ^ asserts that the previous character is a newline (or the beginning of the string), while $ asserts that the next character is a newline (or the end of the string). Perl added more assertions, like the word boundary \b, which asserts that the previous character is alphanumeric but the next is not, or vice versa.
外部リンク[html]:swtch.com

確かにマッチに含まれないという意味ではよくassertionであると言われるlookback/aheadと同様です
何か含めないことで利点があるのでしょうか?
223: 2024/11/09(土)12:53 ID:k7Zpjetb(1) AAS
これに答えられる人はここに数人いるかどうかなのでは
(私はもちろん答えられません)

勘で答えるなら先読み、後読みは後から出てきたものなので元からあった
^ $ \b とは別物扱いになった、とかですかね?すみません、分かりません
1-
あと 54 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.016s