[過去ログ] Regular Expression(正規表現) Part15 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
660(1): デフォルトの名無しさん [sage] 2021/04/18(日)13:04 ID:8BgTcnje(1)
構造があるものは、正規表現では難しい。
スクレイピングは、Ruby で、nokogiri なら、
require 'nokogiri'
doc = Nokogiri::HTML(<<EOT)
<tr>
<td class="XXX">2021/04/02</td> 日付
<td class="YYY">8,510.0</td >始値
<td class="YYY">8,595.0</td> 高値
<td class="YYY">8,432.0</td> 安値
<td class="YYY">8,462.0</td> 終値
<td class="YYY">8,462.0</td> 調整後終値
<td class="YYY">4,337,300</td>出来高
</tr>
EOT
element = doc.at_css( 'tr > td.XXX' )
puts element.content
#=> 2021/04/02
elements = doc.css( 'tr > td.YYY' )
puts elements.map( &:content ).join( " : " )
#=> 8,510.0 : 8,595.0 : 8,432.0 : 8,462.0 : 8,462.0 : 4,337,300
661: デフォルトの名無しさん [] 2021/04/18(日)16:50 ID:GrVz/jbm(2/4)
>660
回答有難うございます テストツールではじかれるのそういうことなんですか
perlでならCSSセレクタ使って取れるんですが遅くてRubyでも同じでしょうね
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.026s