【node.js】サーバサイドjavascript 5【Nashorn】 (796レス)
上下前次1-新
85: 2018/04/04(水)14:38 ID:dci/EUEW(3/3) AAS
参考までに。
Ruby で、Selenium WebDriver で、Chrome のHeadless mode で、
5ch をスクレイピングしたら、文字化けもせずに、テキストが取得できた
ブラウザが、CP932 を自動的に、UTF-8 に変換しているのかな?
driver.navigate.to "2chスレ:linux
element = driver.find_element(:css, 'div[data-id="8"] > div.message > span')
puts "内容 :#{element.text}"
上下前次1-新書関写板覧索設栞歴
あと 711 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.018s