[過去ログ]
Regular Expression(正規表現) Part15 (1002レス)
Regular Expression(正規表現) Part15 http://mevius.5ch.net/test/read.cgi/tech/1568640311/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
300: デフォルトの名無しさん [sage] 2020/07/03(金) 11:07:40.28 ID:cg7dcvev (^<.*?)(".*?)(".*>)$ "$1¥¥$2¥¥$3" ↑vscode内の検索置換 それと全く同じパターンであれば可能だが、dqが複数出てくる場合はできない。 他のパターンも考えたら、 1.dqのみエスケープ、 2.行頭行末にdqをつける の2アクションにするか、vscodeでそれ用のjsでも書いて処理するか。 スニペット登録したいものをまとめて書き出しておいて2アクションで処理しても大して手間は変わらんだろ。 http://mevius.5ch.net/test/read.cgi/tech/1568640311/300
659: デフォルトの名無しさん [] 2021/04/18(日) 11:01:19.33 ID:GrVz/jbm ●Regular Expressionの使用環境 C# ●検索か置換か? 検索 ●説明 表のデータを名前付きでキャプチャしたい(year,month,day;open;high;low;close;volume) 日付 <td class="XXX">(?<year>\d{4})/(?<month>\d?\d)/(?<day>\d?\d)</td> 株価 <td>(?<open>[0-9,.]+)</td>\r\n <td>(?<high>[0-9,.]+)</td>\r\n <td>(?<low>[0-9,.]+)</td>\r\n <td>(?<close>[0-9,.]+)</td>\r\n <td>.*</td>\r\n<td>(?<volume>[0-9,.]+)</td> ●対象データ <tr> <td class="XXX">2021/04/02</td> 日付 <td class="YYY">8,510.0</td >始値 <td class="YYY">8,595.0</td> 高値 <td class="YYY">8,432.0</td> 安値 <td class="YYY">8,462.0</td> 終値 <td class="YYY">8,462.0</td> 調整後終値 <td class="YYY">4,337,300</td>出来高 </tr> ●希望する結果 <td class="XXX">(?<year>\d{4})/(?<month>\d?\d)/(?<day>\d?\d)</td> または<td>(?<open>[0-9,.]+)</td>単独だと一致するが日付と株価を全部つなげると駄目なので一致するようにしたい 御教示よろしくお願いします http://mevius.5ch.net/test/read.cgi/tech/1568640311/659
660: デフォルトの名無しさん [sage] 2021/04/18(日) 13:04:59.48 ID:8BgTcnje 構造があるものは、正規表現では難しい。 スクレイピングは、Ruby で、nokogiri なら、 require 'nokogiri' doc = Nokogiri::HTML(<<EOT) <tr> <td class="XXX">2021/04/02</td> 日付 <td class="YYY">8,510.0</td >始値 <td class="YYY">8,595.0</td> 高値 <td class="YYY">8,432.0</td> 安値 <td class="YYY">8,462.0</td> 終値 <td class="YYY">8,462.0</td> 調整後終値 <td class="YYY">4,337,300</td>出来高 </tr> EOT element = doc.at_css( 'tr > td.XXX' ) puts element.content #=> 2021/04/02 elements = doc.css( 'tr > td.YYY' ) puts elements.map( &:content ).join( " : " ) #=> 8,510.0 : 8,595.0 : 8,432.0 : 8,462.0 : 8,462.0 : 4,337,300 http://mevius.5ch.net/test/read.cgi/tech/1568640311/660
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.047s