[過去ログ] Regular Expression(正規表現) Part14 [無断転載禁止]©2ch.net (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
515: 2018/05/25(金)20:00 ID:OUvr9ihJ(1/3) AAS
頑張ってみてもこの程度が限界
外部リンク:regex101.com

で, >>511がHTMLの解析を正規表現だけでやる理由は何だ?
Pythonのhtml.parser, RubyのNokogiri, PHPならGoutter, それ以外の言語でも間違いなくHTMLパーサは誰かしら作ってる
そんな中で何故正規表現だけで?ぶっちゃけこういう用途には向いてない, というかHTMLの構文規則は正規言語を超えるんだけど, 分かってる?
520: 2018/05/25(金)23:43 ID:OUvr9ihJ(2/3) AAS
>>518
数値以外と簡単に言うが改行文字や空白等の扱いはどうするんだ
変換対象文字をちゃんと明示しないと

/[^0-9]/99/g

こんなもんが欲しいわけではあるまい
とりあえずASCII印字可能文字に限るなら

/[\x21-\x2F\x40-\x7E]/99/g

だが当然マルチバイト文字は対象外
521: 2018/05/25(金)23:44 ID:OUvr9ihJ(3/3) AAS
\x40じゃなくて\x3Aだわ
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.037s