[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
54: デフォルトの名無しさん [] 2021/11/29(月)22:02:03.30 ID:ZJywLyaD(3/3)
>>52
ありがとうございます!うまく行きました!
大変初歩的な間違い、失礼いたしました。。。ご助言ありがとうございます

>>53
ご指摘ありがとうございます。そこの考慮をしていませんでした。
今回はたまたま問題ありませんでしたが、これからは考えます。
ありがとうございました。
66: デフォルトの名無しさん [sage] 2021/12/19(日)06:09:19.30 ID:X6k+U6Sv(1)
成果だけ横から頂いてこっちで改変流用するわwおまえ除名なwとか言われちゃったらまあ拗ねもするさ
350
(1): デフォルトの名無しさん [sage] 2022/07/03(日)11:46:22.30 ID:DiSdIFQe(1/3)
初心者のうちは強欲は使わないほうがいい気がする

そもそも鈍器のページから店名と住所を取り出すだけの正規表現を書く場合にキャプチャしない書き方や
バックトラックを抑制する書き方をする必要はない

「策士策に溺れる」になってるから質問者に何を教えるべきなのかもう一度考えるべし
359
(1): デフォルトの名無しさん [sage] 2022/07/03(日)18:20:19.30 ID:K4HcDkkQ(1)
どうしようもないケースを除いて「東京都」なんてのをハードコーディングするのは筋が悪いと言わざるを得ない
447: デフォルトの名無しさん [sage] 2022/07/05(火)22:07:33.30 ID:mmXAp8Yt(2/2)
同一人物のくせに他人のフリとかどんだけ面の皮厚いんだよ・・・とか一瞬思ったけど
ID:K5Eu4yGwID:nkFK6+7O ID:4sOf+wSV は別人だったのか
見分けついてなくて同一レベルのゴミかと思ってたわごめん
538
(1): デフォルトの名無しさん [sage] 2022/10/29(土)13:09:46.30 ID:ec13kmtS(1/2)
●Regular Expressionの使用環境
PCRE2

●検索か置換か?
検索

●説明
(..[\0@-g]\0){147}などを高速に検索したい

●対象データ
メガ単位のバイナリファイル(リトルエンディアン)

●希望する結果
説明は一例なので前中後にリテラルパターンが入る事もありますが(16KiBを越える事も)、固定長で
一定範囲だが不明な32bit値(0または0x00400000〜0x00670000付近)を含むブロック位置を列挙したいです

現状PCRE2で検索は出来ていますが、Intel Hyperscanだと
util/determinise.h:determinise:162:succ_id 16383 >= state_limit 16383
ng_mcclellan.cpp:buildMcClellan:590:state limit exceeded
rose_build_add.cpp:addOutfix:1779:could not build as either an NFA or a DFA
ng.cpp:addGraph:507:could not compile component 0 with 592 vertices
と言われて説明の例に限っては正規表現のコンパイルすら不可能です

32bit値は4バイト境界に限りませんが、ブロック先頭は4バイト境界なのでそこから高速化したいのですが
「(?>....)*?\K」を接頭しようとするとPCRE2_ANCHOREDはJITで使えませんし、そもそも遅くなるようです
今のところプログラム側でオフセットが4バイト境界のみを拾い、次の検索開始もアライメントしています
コールアウトもお察し…こういったパターンに適した書き方、又はCライブラリが有れば教えて欲しいです
593: 591 [sage] 2022/12/31(土)22:37:29.30 ID:yp0KXAnH(2/2)
大晦日のツンデレさんに圧倒的感謝!!
ありがとうございます
672
(1): デフォルトの名無しさん [sage] 2023/04/19(水)17:20:57.30 ID:WqdbOhNP(1)
https://regex101.com/r/xvZeom/1
708
(2): デフォルトの名無しさん [sage] 2023/06/18(日)00:06:22.30 ID:7IbgNtYk(1)
NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表
japan.zdnet.com/article/35205348/

perl-5.38.0-RC1 perlre.pod
metacpan.org/release/RJBS/perl-5.38.0-RC1/view/pod/perlre.pod

(鬼車) 不在機能群の入れ子 の動作テスト集
github.com/tonco-miyazawa/regex_etc/blob/master/MEMO_onig/abcent/nesting.txt
782: デフォルトの名無しさん [sage] 2023/07/10(月)13:05:06.30 ID:8apozFwM(1/2)
> ab < あ

マルチバイト文字を含む文字列に対して (?L) は使いにくいな
文字単位での長さで比較するようにするのは重くなる上に難易度高そう
783: デフォルトの名無しさん [sage] 2023/07/10(月)20:06:05.30 ID:8apozFwM(2/2)
JaneStyleが5ch.netのサポートを終了
この前NG登録出来て喜んでた人かわいそす
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.049s