[過去ログ]
Regular Expression(正規表現) Part16 (1002レス)
Regular Expression(正規表現) Part16 http://mevius.5ch.net/test/read.cgi/tech/1635936601/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
452: デフォルトの名無しさん [sage] 2022/07/06(水) 05:39:49.51 ID:FCzm9xaa 口頭ってことは対面レビューとか他の人と共有するソースコードでの正規表現だよね? そうなると、相手のスキルレベルにもよるけど 「強欲」って単語だけでなく強欲な正規表現自体も避けておくかなあ このスレのうんざりする流れを見てもわかるとおり「強欲」が相手に通じるとは限らないし (強欲な正規表現なんて使ったことがない人のほうが多数派だろうし) 最長一致で事足りるなら多少のパフォーマンス悪化には目をつぶる チャットとかなら「++」みたいな具体例を明示して「強欲」って単語を使うかな ここみたいな正規表現スレならなにも前提を置かなくとも普通に「強欲」で通じるものとして会話するけど・・・ 会話が成り立たなかったうえに間違いを指摘されても「英語だと」「口語だと」「xxxだと」とか延々ゴネる人とは会話したくないなあ いい加減NGしたいからコテつけてくれるとありがたい http://mevius.5ch.net/test/read.cgi/tech/1635936601/452
453: デフォルトの名無しさん [sage] 2022/07/06(水) 06:39:20.23 ID:5qGkM3IH しかし回答者のレベル低下が酷いな ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな $1,$2の件や強欲のすれ違いについても積極的に事態の収集を図ろうとせず悪化させて悪乗りするとはね http://mevius.5ch.net/test/read.cgi/tech/1635936601/453
454: デフォルトの名無しさん [sage] 2022/07/06(水) 06:47:28.85 ID:TTp+bFLp 英語名を変えさせたら良い gohyork yorkvary muyork 対応して日本語名もカタカナ表記で ゴヨーク ヨークバリー ムヨーク そういう『名前』としてしまえば解決 一意な名称を与えた方が誤解も少なくなるだろう > 強欲な正規表現なんて使ったことがない人のほうが多数派だろうし それはあまりにもレベルが低すぎじゃね? 知らない者が学ぶべきであって触りすらも学んだことの無い者へ合わせる必要なんて無い http://mevius.5ch.net/test/read.cgi/tech/1635936601/454
455: 298 [] 2022/07/06(水) 06:53:49.49 ID:ZAN9ui5m >>361 > それ書いてる>>314には$1なんてどこにも書いて無いのにw つまり、>>314の「,」があまりに小さくて見えなくて、 (?<=店)[^〒]*?〒\d{3}-\d{4}\s++ これしか書いてなくて、 2行目の$1,$2を省略したと思ったのですw http://mevius.5ch.net/test/read.cgi/tech/1635936601/455
456: デフォルトの名無しさん [sage] 2022/07/06(水) 07:02:49.27 ID:5qGkM3IH ここの回答者はそう勘違いしてるのを知ってて何も助言しなかったんだぞ、馬鹿にして笑ってたんだよ このスレは過疎たせいで悪質な初心者が上級者ヅラするようになってしまった http://mevius.5ch.net/test/read.cgi/tech/1635936601/456
457: 298 [] 2022/07/06(水) 07:06:06.70 ID:ZAN9ui5m 秋葉原店 専門店 住所 〒101-0021 東京都千代田区外神田4丁目3-3 TEL 0570-024-511 ~ ~ で、さらに教えて欲しいのですが、 前回と同じ質問ですが、 店名と住所を抽出したいです。 で、↓を使いたいのですが、 店を抽出キーワードにすると、専門店とか店舗詳細とかの「店」も拾ってしまうのです。 で、データをよくみると、「 秋葉原店」のように店名の前にスペースがあります。 で、 ( )(?<=店)[^〒]*〒\d{3}-\d{4}\s++ と、やってみたのですがダメでした。 どうすればよいでしょうか? (?<=店)[^〒]*〒\d{3}-\d{4}\s++ ←は>>314さんの教えてくれたヤツ。 http://mevius.5ch.net/test/read.cgi/tech/1635936601/457
458: デフォルトの名無しさん [sage] 2022/07/06(水) 07:09:45.51 ID:SZC2q9b+ これ非包含演算子に粘着してるのと同じやつだろ 粘着気質と承認欲求丸出しのマウンティング気質が全く同じ http://mevius.5ch.net/test/read.cgi/tech/1635936601/458
459: デフォルトの名無しさん [sage] 2022/07/06(水) 07:46:05.23 ID:o/55z/m0 >>453 再質問来てるぞ > ドンキホーテの件にしてもページの置換結果がそのまま店一覧のCSV形式になるような置換をして欲しかったな おまえがお手本見せてやれや 回答者をバカにするくらいだから余裕だろ? >>457 >>320 使い方分からないならJSスレか初心者スレ行って聞いたらいい http://mevius.5ch.net/test/read.cgi/tech/1635936601/459
460: 298 [] 2022/07/06(水) 08:07:45.17 ID:ZAN9ui5m >>459 ↓って英語だからどうやって使っていいのかわかりません。 https://pastebin.com/M6LqV15b http://mevius.5ch.net/test/read.cgi/tech/1635936601/460
461: デフォルトの名無しさん [] 2022/07/06(水) 11:44:54.56 ID:MXaUuSJv まず英語の勉強をするべき http://mevius.5ch.net/test/read.cgi/tech/1635936601/461
462: デフォルトの名無しさん [sage] 2022/07/06(水) 12:10:15.16 ID:c6fRPAAn CSV の正規表現なんて、数千行ぐらい掛かるだろ。 HTTP の正規表現でも膨大だろ 行区切り文字の改行 列区切り文字のカンマ クォート文字のダブルクォーテーション。 クォート文字が無くても、意味が変わらなければ省略できる クォート文字内では、行区切り文字・列区切り文字の効果がなくなり、単なる文字となる。 クォート文字内で、連続した2つのクォート文字を使えば、 クォート文字の効果がなくなり、単なる1つのクォート文字となる もし、クォート文字の対応関係が崩れたらエラー。 クォート文字の数は、必ず偶数個である こんな膨大な条件判断を書けるわけない。 条件判断とか構造があるものは、正規表現では無理。 こういうものは、Ruby などのパーサーを使わないと無理 CSVをawk などで処理している香具師とか、CSVの構造を分かっていないから、 こういう特別な意味をもつ文字が混じると、バグル http://mevius.5ch.net/test/read.cgi/tech/1635936601/462
463: デフォルトの名無しさん [sage] 2022/07/06(水) 13:40:21.16 ID:gR1YTmZs >>462 なんでCSVのパースする前提になってるんだ? webの店舗情報のテキストをCSVにするのになんでクォート内の対応を気にする必要がある? http://mevius.5ch.net/test/read.cgi/tech/1635936601/463
464: デフォルトの名無しさん [] 2022/07/06(水) 15:43:31.34 ID:MXaUuSJv KEИTAはでたらめ http://mevius.5ch.net/test/read.cgi/tech/1635936601/464
465: 462 [sage] 2022/07/06(水) 17:15:52.66 ID:c6fRPAAn 行区切り文字の改行、列区切り文字のカンマ、 クォート文字のダブルクォーテーション CSV データ内に、こういう特別な意味をもつ文字が混じると、バグル これらの文字が無ければ、Ruby などのCSVパーサーを使わずに、 awk などで処理しても、バグらない http://mevius.5ch.net/test/read.cgi/tech/1635936601/465
466: デフォルトの名無しさん [sage] 2022/07/06(水) 17:19:01.24 ID:QeuQIz9d なんか話脱線マウントしまくって会議やコードレビュー下手くそで顰蹙を買いまくってそうな人来てるやん http://mevius.5ch.net/test/read.cgi/tech/1635936601/466
467: デフォルトの名無しさん [sage] 2022/07/06(水) 17:55:19.63 ID:gR1YTmZs >>465 混ぜなきゃいいのでは http://mevius.5ch.net/test/read.cgi/tech/1635936601/467
468: デフォルトの名無しさん [sage] 2022/07/06(水) 19:01:53.46 ID:kQhbtDqq いつも文体一緒だからバレる http://mevius.5ch.net/test/read.cgi/tech/1635936601/468
469: デフォルトの名無しさん [sage] 2022/07/06(水) 19:30:39.95 ID:5qGkM3IH >> 298 「店」が無い店もあったからHTMLソースから取り出すようにしたよ ブラウザでHTMLソースを表示させてnotepad++にソースをコピペしてから置換して 1回目の検索欄 ^[^\r\n]*<h4\s+[^>]*class=["']?shopList[_\-\s]*storeName["']?[^>]*>\s*<span[^>]*>\s*</span\s*>\s*([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s* </h4\s*>(?:(?!<dd[^>]*>\s*〒|<h4)(?:[\r\n]|.))*<dd[^>]*>\s*〒\s*[\d\-]+\s+([^\s<>\r\n]+(?:\s+[^\s<>\r\n]+)*)\s*</dd\s*>[^\r\n]*$ 1回目の置換欄 うんこ$1,$2 2回目の検索欄 ^(?!うんこ)[^\r\n]*$[\r\n]+ 1回目の置換欄 ( 空欄にして ) 2回の置換が終われば店舗一覧が完成しているはず 1回目の検索欄は長すぎるから2行に分割したよ、1行に繋げてから使って 検索欄や置換欄に記入するときは前後に余計なスペースやタブ文字が紛れ込まないように HTMLの細かい変化にはなるべく対応出来るようにしたけど店舗一覧のページがリニューアルしたら使えなくなるよ http://mevius.5ch.net/test/read.cgi/tech/1635936601/469
470: デフォルトの名無しさん [sage] 2022/07/06(水) 19:34:28.40 ID:5qGkM3IH ミスった 1回目の置換欄 ( 空欄にして ) これは2回目だね http://mevius.5ch.net/test/read.cgi/tech/1635936601/470
471: デフォルトの名無しさん [sage] 2022/07/06(水) 19:39:45.64 ID:5qGkM3IH 全国の店舗一覧を取得したいならwgetなどで各店舗一覧ページをローカルに保存してからnotepad++のファイル一括置換でまとめて置換したほうが楽 「wgetの使い方が分かりません」はスレ違いなのでよそで聞いて http://mevius.5ch.net/test/read.cgi/tech/1635936601/471
472: デフォルトの名無しさん [sage] 2022/07/06(水) 23:10:34.54 ID:gFUK7vgi ホンの少し複雑化しただけで頭の悪さや性格って浮かび上がるよねw http://mevius.5ch.net/test/read.cgi/tech/1635936601/472
473: デフォルトの名無しさん [sage] 2022/07/07(木) 16:29:53.46 ID:ls1FMHZL そのまま正規表現1回でやるのと、改行の種類とかあったりなかったりする要素とか明らかに不要な要素を掃除してからやるのとどっちがいいですか http://mevius.5ch.net/test/read.cgi/tech/1635936601/473
474: デフォルトの名無しさん [sage] 2022/07/07(木) 16:37:27.46 ID:3hUwVJb0 掃除して整形してからやるのがコスパ良いに決まってる 力業いくない http://mevius.5ch.net/test/read.cgi/tech/1635936601/474
475: デフォルトの名無しさん [sage] 2022/07/07(木) 17:27:59.03 ID:EezL89dt ケースバイケースやろ http://mevius.5ch.net/test/read.cgi/tech/1635936601/475
476: デフォルトの名無しさん [sage] 2022/07/07(木) 17:45:22.88 ID:QZNfJ5wA 答え合わせ出来るとか、間違いに気付き易いor間違い難いケースは1発 合ってるか分かり難い場合は間違い難い正規化式で段階踏む http://mevius.5ch.net/test/read.cgi/tech/1635936601/476
477: デフォルトの名無しさん [sage] 2022/07/08(金) 12:52:02.00 ID:/znuHP85 パイプ・フィルターみたいに、どんどん変換していく方が分かりやすい。 処理A | 処理B | 処理C Ruby の正規表現では、3種類の改行を、\R と書ける /\r\n|\r|\n/ /\R/ http://mevius.5ch.net/test/read.cgi/tech/1635936601/477
478: デフォルトの名無しさん [sage] 2022/07/10(日) 17:44:55.47 ID:0O2dRiW8 >possesive ポジティブ http://mevius.5ch.net/test/read.cgi/tech/1635936601/478
479: デフォルトの名無しさん [sage] 2022/07/16(土) 01:09:47.27 ID:gUwlqT3Y そして誰もいなくなった http://mevius.5ch.net/test/read.cgi/tech/1635936601/479
480: デフォルトの名無しさん [sage] 2022/07/16(土) 09:09:55.88 ID:L4T2PUf2 民度の低い異常者が常駐してたらそりゃ関わりたくないもん http://mevius.5ch.net/test/read.cgi/tech/1635936601/480
481: デフォルトの名無しさん [sage] 2022/07/16(土) 11:12:47.12 ID:WasoqaBj 自己紹介乙 http://mevius.5ch.net/test/read.cgi/tech/1635936601/481
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 521 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.022s