[過去ログ] 2ch ブラウザ JD 20 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
701
(4): 2018/08/22(水)02:40 ID:S7jO2dtu(1) AAS
Ruby で、Selenium WebDriver を使って、
5ch のスレの書き込みから、画像ファイルのURL だけを抜き出して、
ブラウザで表示しようとしたが、

Selenium WebDriverから、5ch のページに、なかなかつながらない!

5ch のページはクソ!
無限にJavaScript(JS) が動いていて、つながるタイミングが無い。
おまけに、JS でしょっちゅうエラーが起きているw

こんなに無限に読み込むページは、前代未聞!
702
(1): 2018/08/22(水)02:45 ID:38GpJQxX(1/3) AAS
>>701
静的なHTMLを解析するのこぎりとかじゃだめなの?
703
(1): 2018/08/22(水)02:47 ID:38GpJQxX(2/3) AAS
>>701
盛大なスレチだったわ。他スレ誘導してくれたら相談乗るよ。
714
(1): 701 2018/08/23(木)01:42 ID:5vbOyklZ(1) AAS
>>702-703
5ch の静的なHTML には、何も内容がない。
最初に、空のHTML を送ってきて、非同期処理(Ajax) で投稿内容を取得して表示するから

だから、Selenium WebDriver を使って、ブラウザを操作しないといけない。
投稿内容が表示されるまで、待たないといけない

たぶん専ブラは、HTML じゃなくて、元のデータから投稿内容を取得しているのだろう
715: 2018/08/23(木)09:42 ID:LzPJ2Ens(1) AAS
>>714
>>701ってこのスレと何の関係が?
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.033s