2ちゃんねる用ブラウザ「ギコナビ」Part100 (409レス)
上下前次1-新
抽出解除 レス栞
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
74(2): 名無しさん@お腹いっぱい。 [sage] 2025/07/17(木) 01:29:43.97 ID:Ycy3XGuo0(2/2) AAS
>>7272(1): 名無しさん@お腹いっぱい。 [] 2025/07/17(木) 00:34:30.01 ID:T1EE1PhC0(1) AAS
>>71
>^[A-Z]{4000,}$
改行部が含まれないから
>^(?:[A-Z¥s<>]{1,}<br>¥s*){40,}[A-Z¥s<>]*$
改行`<br>`の初めの`<`が`[A-Z¥s<>]{1,}`によって食われるから
(?:[A-Z]{64} <br> ){2}
若しくは[A-Z]が20文字以上連続しているので
(?:[A-Z]{20,} <br> ){2}
これで行けませんか?
(改行部が生DATと同じとして)
>>73お二人のアドバイスのおかげで、荒らしレスをNGすることができました
自分でもいくつか試していたのですが、
「^[A-Z]{200,}$」
「^([A-Z]+(?:<br>\s*[A-Z]+)*){200,}$」
「^[A-Z]+(?:<br>\s*[A-Z]+){100,}\s*<>\s*$」
といった正規表現では、なぜかマッチしなくて困っていました
お二人の正規表現が効果的だったので、
最終的にこの二つを組み合わせた
「(?:[A-Z]{20,} <br> ){2}|[A-Z\s<br>]{1000,}」
で設定したところ、無事NGできるようになりました!
ギコナビの内部的な処理の違いなど、自分では気づけない部分があったのだと思います
本当にありがとうございました
77: 名無しさん@お腹いっぱい。 [] 2025/07/17(木) 15:33:12.80 ID:9dnCOOUm0(1) AAS
>>74
>[A-Z¥s<br>]
[]の中は文字列の並びじゃなくて文字のリスト
なのでそんな書き方しても
[<>A-Zbr¥s]
と解釈されます
そのことを理解の上で活用してくださいな
78: 名無しさん@お腹いっぱい。 [sage] 2025/07/17(木) 21:16:52.64 ID:I+RDsoT+0(1) AAS
>>74
ギコナビのNGは生DATの1レス分を1行として処理
名前<>sage<>yyyy/mm/dd(曜) hh:mm:ss.dd ID:id <> 本文 <>
本文の冒頭と一致させるには「^」でなく「\x20<>\x20」
本文の末尾と一致させるには「$」でなく「\x20<>$」
(正規表現2でない場合\x20は半角空白1つにする)
この置換で71の2つ目は「正規表現2」で機能したよ
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.025s