[過去ログ] Regular Expression(正規表現) Part16 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
462
(2): 2022/07/06(水)12:10 ID:c6fRPAAn(1/2) AAS
CSV の正規表現なんて、数千行ぐらい掛かるだろ。
HTTP の正規表現でも膨大だろ

行区切り文字の改行
列区切り文字のカンマ

クォート文字のダブルクォーテーション。
クォート文字が無くても、意味が変わらなければ省略できる

クォート文字内では、行区切り文字・列区切り文字の効果がなくなり、単なる文字となる。
クォート文字内で、連続した2つのクォート文字を使えば、
クォート文字の効果がなくなり、単なる1つのクォート文字となる

もし、クォート文字の対応関係が崩れたらエラー。
省6
463: 2022/07/06(水)13:40 ID:gR1YTmZs(1/2) AAS
>>462
なんでCSVのパースする前提になってるんだ?
webの店舗情報のテキストをCSVにするのになんでクォート内の対応を気にする必要がある?
464: 2022/07/06(水)15:43 ID:MXaUuSJv(2/2) AAS
KEИTAはでたらめ
465
(1): 462 2022/07/06(水)17:15 ID:c6fRPAAn(2/2) AAS
行区切り文字の改行、列区切り文字のカンマ、
クォート文字のダブルクォーテーション

CSV データ内に、こういう特別な意味をもつ文字が混じると、バグル

これらの文字が無ければ、Ruby などのCSVパーサーを使わずに、
awk などで処理しても、バグらない
466: 2022/07/06(水)17:19 ID:QeuQIz9d(1) AAS
なんか話脱線マウントしまくって会議やコードレビュー下手くそで顰蹙を買いまくってそうな人来てるやん
467: 2022/07/06(水)17:55 ID:gR1YTmZs(2/2) AAS
>>465
混ぜなきゃいいのでは
468: 2022/07/06(水)19:01 ID:kQhbtDqq(1) AAS
いつも文体一緒だからバレる
469: 2022/07/06(水)19:30 ID:5qGkM3IH(3/5) AAS
>> 298

「店」が無い店もあったからHTMLソースから取り出すようにしたよ
ブラウザでHTMLソースを表示させてnotepad++にソースをコピペしてから置換して

1回目の検索欄
^[^\r\n]*<h4\s+[^>]*class=["']?shopList[_\-\s]*storeName["']?[^>]*>\s*<span[^>]*>\s*</span\s*>\s*([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*
</h4\s*>(?:(?!<dd[^>]*>\s*〒|<h4)(?:[\r\n]|.))*<dd[^>]*>\s*〒\s*[\d\-]+\s+([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*</dd\s*>[^\r\n]*$

1回目の置換欄
うんこ$1,$2

2回目の検索欄
^(?!うんこ)[^\r\n]*$[\r\n]+
省6
470: 2022/07/06(水)19:34 ID:5qGkM3IH(4/5) AAS
ミスった

1回目の置換欄
( 空欄にして )

これは2回目だね
471: 2022/07/06(水)19:39 ID:5qGkM3IH(5/5) AAS
全国の店舗一覧を取得したいならwgetなどで各店舗一覧ページをローカルに保存してからnotepad++のファイル一括置換でまとめて置換したほうが楽
「wgetの使い方が分かりません」はスレ違いなのでよそで聞いて
472: 2022/07/06(水)23:10 ID:gFUK7vgi(1) AAS
ホンの少し複雑化しただけで頭の悪さや性格って浮かび上がるよねw
473: 2022/07/07(木)16:29 ID:ls1FMHZL(1) AAS
そのまま正規表現1回でやるのと、改行の種類とかあったりなかったりする要素とか明らかに不要な要素を掃除してからやるのとどっちがいいですか
474: 2022/07/07(木)16:37 ID:3hUwVJb0(1) AAS
掃除して整形してからやるのがコスパ良いに決まってる
力業いくない
475: 2022/07/07(木)17:27 ID:EezL89dt(1) AAS
ケースバイケースやろ
476: 2022/07/07(木)17:45 ID:QZNfJ5wA(1) AAS
答え合わせ出来るとか、間違いに気付き易いor間違い難いケースは1発
合ってるか分かり難い場合は間違い難い正規化式で段階踏む
477: 2022/07/08(金)12:52 ID:/znuHP85(1) AAS
パイプ・フィルターみたいに、どんどん変換していく方が分かりやすい。
処理A | 処理B | 処理C

Ruby の正規表現では、3種類の改行を、\R と書ける

/\r\n|\r|\n/

/\R/
478: 2022/07/10(日)17:44 ID:0O2dRiW8(1) AAS
>possesive

ポジティブ
479: 2022/07/16(土)01:09 ID:gUwlqT3Y(1) AAS
そして誰もいなくなった
480: 2022/07/16(土)09:09 ID:L4T2PUf2(1) AAS
民度の低い異常者が常駐してたらそりゃ関わりたくないもん
481: 2022/07/16(土)11:12 ID:WasoqaBj(1) AAS
自己紹介乙
1-
あと 521 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.020s