[過去ログ] Regular Expression(正規表現) Part14 [無断転載禁止]©2ch.net (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
583
(13): 2018/08/26(日)18:08 ID:sCPJIsfv(2/4) AAS
自分用に作るならこんな感じかなぁ、動作確認してないので使わないでね

|
<meta (?=\s) [^<>]* \s charset \s* = \s* (?:["']\s*)? ([^\s"'<>;]+)
|x;

こういうのは想定外  ※  " " の中に > がある

<meta comment="a>b" charset="UTF-8">
584: 2018/08/26(日)18:17 ID:O4hA/SKg(1) AAS
>>583
俺が書いた糞(>>559)より糞なコードが書かれて驚く
素直にパーサ使えよ
585: 2018/08/26(日)18:36 ID:sCPJIsfv(3/4) AAS
>>583 のほうがスマートなのは一目瞭然でしょ
ただ >>583 は こんな感じ 程度のものなのでツッコミ所があっても知らないよ
588: 2018/08/27(月)04:46 ID:2QlJLeh2(1) AAS
マッチングテスト

[1] <meta charset="UTF-8">
>>557 1. 失敗
>>559   マッチ
>>583   マッチ
>>586   マッチ

[2] このスレのHTML
557 1. マッチ
559   失敗
583   マッチ
586   失敗
607
(2): 583 2018/09/18(火)00:55 ID:t0fL3l18(1/6) AAS
>>605のリンク先見てやっつけで作ってみた

<xx>(?>(?:(?!</?xx>).)*)</xx>|<xx>((?'open'<xx>(?>(?:(?!</?xx>).)*))+(?'-open'</xx>(?>(?:(?!</?xx>).)*))+)*</xx>(?(open)(?!))
609: 583 2018/09/18(火)02:17 ID:t0fL3l18(2/6) AAS
ミスってた、>>607はボツってことで・・
タグとタグの間の文字列の扱いが意外と難しい
620: 583 2018/09/18(火)12:56 ID:t0fL3l18(3/6) AAS
本来の数学的な正規表現という意味では向いてる質問なんだけどね
これぞ正規表現の仕事っていう質問

でもプログラムの検索で使う正規表現ではなかなか使われないね
621: 583 2018/09/18(火)13:25 ID:t0fL3l18(4/6) AAS
>>607を修正

<xx>(?>(?:(?!</?xx>).)*)((?'open'<xx>(?>(?:(?!</?xx>).)*))+(?'-open'</xx>(?>(?:(?!</?xx>).)*))+)*</xx>(?(open)(?!))

これは>>605のリンク先の例を↓のように書き換えただけ

< を <xx>・・・
> を </xx>・・・
\A を <xx>
\z を </xx>

「・・・」 は<xx>または</xx>の間に挟まれている文字列

>スタック使う構文が必要な時点で
ああ、その通りだ、(r+s+)+ だけでは作れない
622: 583 2018/09/18(火)13:29 ID:t0fL3l18(5/6) AAS
間違い
\A を <xx>

正しくは
\A を <xx> ・・・
623: 583 2018/09/18(火)18:51 ID:t0fL3l18(6/6) AAS
>>611のはミスってるね
<xx><b><a>111</a></a></xx> にマッチする
<xx><b><a>111</a></b></xx> にマッチしない
この問題は>>617で修正されてる

()* \d+ ()* のところが0回以上のループで正しく動くのは面白いな
一番外側の (?: )* はいらないかも
624: 583 2018/09/21(金)05:18 ID:LI7qokUP(1/6) AAS
(?# 主要部)
<xx(?&Attribute)>(?&innerText)(?&roop)?+</xx>

(?# 定義部)
(?:|(?!)
(?'Attribute'(?:\s[^>]*+)?+)
(?'singletag'br)
(?'tagname'[a-z][a-z\d]*+)

(?'innerText'
(?: [^<]*+
| <(?&singletag)(?&Attribute)>
)*+
)

(?'roop'
<(?'tag'(?&tagname))(?&Attribute)>
(?&innerText)(?&roop)?+
</\k'tag+0'>
(?&innerText)(?&roop)?+
)
)
629
(1): 583 2018/09/21(金)19:24 ID:LI7qokUP(5/6) AAS
>>628
テキストエディタの正規表現の入力ウインドウに付けて欲しいんだ
次世代のテキストエディタは↓こうなって欲しい

1、画面をいっぱいに使って正規表現の複数行の記述が出来る
2、複数行で書かれた正規表現を一行に繋げるボタン
3、一行で書かれた正規表現を複数行に展開するボタン

これがスタンダードになるといいな
633
(1): 583 2018/09/21(金)23:41 ID:LI7qokUP(6/6) AAS
>>632
そういうことじゃないんだな、>>626を読んでね

ちなみに複数行の正規表現を一行に繋げるのはかなり簡単なんだけど
一行で書かれた正規表現を複数行に展開するのはかなり難しい
正規表現のパーサを作るということになるから

だから正規表現ライブラリに実装されることが望ましい
ライブラリの作者なら細かい挙動まで把握しているから正確なパーサが作れる

逆にテキストエディタの作者がやろうとすると動作を把握しきれずに
不完全なものになったり、実装を諦めたりすることになりかねない
複数行をスタンダードにするためにはライブラリ側での実装が必須となる
635: 583 2018/09/22(土)21:31 ID:SLHR4wJP(1) AAS
>>634
bregonig.dllはプログラミング用のライブラリをテキストエディタでも
使えるようにしたっていう感じなのでプログラミングに必要のない機能は
付けたくないと思う、管理が大変になるからね
だから次世代の正規表現ライブラリと次世代のテキストエディタに期待

ちなみにテキストエディタに重きを置いたライブラリならこんなのが可能になるはず

検索:( red(?'color='赤) | blue(?'color='青) | yellow(?'color='黄) )
置換:\k'color'

対象テキスト: blue
置換結果:青

現状の bregonig.dll でこれが出来ないということはプログラミングでなんとかなる
機能は付けないということ

テキストエディタのほうは改行をまたぐマッチの実現に苦戦してるようで
この問題が解決しないと高度な正規表現は宝の持ち腐れになるだけなので
次世代のテキストエディタに期待しましょう

>鬼車オリジナルの作者さん
別人だとは知りませんでした^^;
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.036s