[過去ログ]
Regular Expression(正規表現) Part15 (1002レス)
Regular Expression(正規表現) Part15 http://mevius.5ch.net/test/read.cgi/tech/1568640311/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
4: デフォルトの名無しさん [sage] 2019/09/17(火) 01:53:27.68 ID:JrU+31ml 正規表現技術入門 https://gihyo.jp/book/2015/978-4-7741-7270-5 ↑の著者の一人であり Onigmo の作者でもあるtakata先生のツイ https://twitter.com/k_takata https://twitter.com/5chan_nel (5ch newer account) http://mevius.5ch.net/test/read.cgi/tech/1568640311/4
398: デフォルトの名無しさん [] 2020/09/20(日) 19:06:52.11 ID:shjW7F5c 5chのスレタイはこん感じで入っている <a href="1599110613/l50">1: ぶっちゃけ始めるのにいい言語て何 part3 (78)</a> <a href="1545032904/l50">2: 文字コード総合スレ Part12 (95)</a> <a href="1598112455/l50">3: Rust part9 (198)</a> <a href="1598336253/l50">4: 小6におすすめな言語 (32)</a> <a href="1594528940/l50">5: C++相談室 part152 (404)</a> <a href="1596690797/l50">6: Xamarin Part7 (97)</a> <a href="1598527450/l50">7: くだすれPython(超初心者用) その50【まず1嫁】 (423)</a> ここからたとえば「言語」とついたスレタイだけ抽出するのは無理だった <a href="1599110613/l50">1: ぶっちゃけ始めるのにいい言語て何 part3 (78)</a> <a href="1598336253/l50">4: 小6におすすめな言語 (32)</a> http://mevius.5ch.net/test/read.cgi/tech/1568640311/398
659: デフォルトの名無しさん [] 2021/04/18(日) 11:01:19.33 ID:GrVz/jbm ●Regular Expressionの使用環境 C# ●検索か置換か? 検索 ●説明 表のデータを名前付きでキャプチャしたい(year,month,day;open;high;low;close;volume) 日付 <td class="XXX">(?<year>\d{4})/(?<month>\d?\d)/(?<day>\d?\d)</td> 株価 <td>(?<open>[0-9,.]+)</td>\r\n <td>(?<high>[0-9,.]+)</td>\r\n <td>(?<low>[0-9,.]+)</td>\r\n <td>(?<close>[0-9,.]+)</td>\r\n <td>.*</td>\r\n<td>(?<volume>[0-9,.]+)</td> ●対象データ <tr> <td class="XXX">2021/04/02</td> 日付 <td class="YYY">8,510.0</td >始値 <td class="YYY">8,595.0</td> 高値 <td class="YYY">8,432.0</td> 安値 <td class="YYY">8,462.0</td> 終値 <td class="YYY">8,462.0</td> 調整後終値 <td class="YYY">4,337,300</td>出来高 </tr> ●希望する結果 <td class="XXX">(?<year>\d{4})/(?<month>\d?\d)/(?<day>\d?\d)</td> または<td>(?<open>[0-9,.]+)</td>単独だと一致するが日付と株価を全部つなげると駄目なので一致するようにしたい 御教示よろしくお願いします http://mevius.5ch.net/test/read.cgi/tech/1568640311/659
660: デフォルトの名無しさん [sage] 2021/04/18(日) 13:04:59.48 ID:8BgTcnje 構造があるものは、正規表現では難しい。 スクレイピングは、Ruby で、nokogiri なら、 require 'nokogiri' doc = Nokogiri::HTML(<<EOT) <tr> <td class="XXX">2021/04/02</td> 日付 <td class="YYY">8,510.0</td >始値 <td class="YYY">8,595.0</td> 高値 <td class="YYY">8,432.0</td> 安値 <td class="YYY">8,462.0</td> 終値 <td class="YYY">8,462.0</td> 調整後終値 <td class="YYY">4,337,300</td>出来高 </tr> EOT element = doc.at_css( 'tr > td.XXX' ) puts element.content #=> 2021/04/02 elements = doc.css( 'tr > td.YYY' ) puts elements.map( &:content ).join( " : " ) #=> 8,510.0 : 8,595.0 : 8,432.0 : 8,462.0 : 8,462.0 : 4,337,300 http://mevius.5ch.net/test/read.cgi/tech/1568640311/660
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.044s