[過去ログ] 2ch ブラウザ JD 20 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
583
(1): 575 2018/07/06(金)06:31 ID:NnyYQwVi(2/2) AAS
Ruby で、Selenium WebDriver で、Chrome を使って、
5ch の乃木坂板の1つのスレから、画像のURL を抜き出せた

re = /\.(jpeg|jpg|png|gif)$/i # 画像の拡張子

elements = driver.find_elements(:class => "post") # すべての投稿

elements.each do |elem|
elems = elem.find_elements(:css, "div.message > span > a")
elems.each { |e| puts e.text if re.match(e.text)} # URL
end
599
(2): 575 2018/07/07(土)07:55 ID:7S0kzh4L(1) AAS
>>585

>>583 にも書いたように、
各投稿の、div.message > span > a の、画像のURL には1つしか書いていない

サムネはないから、読み込んでいるのはその画像だけなので、
画像の通信料・データ量の節約にはならない

ImageMagick などで、画像を変換してサムネを作っているのか、
単に小さく表示しているのか、知らないけど、
大きく表示した方が、見やすいと思う
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.041s