[過去ログ]
【PHP】下らねぇ質問はここに書き込みやがれ 11 (1002レス)
【PHP】下らねぇ質問はここに書き込みやがれ 11 http://mevius.5ch.net/test/read.cgi/tech/1591334726/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
117: デフォルトの名無しさん (ワッチョイ 5f2c-Yghi) [sage] 2020/06/22(月) 12:09:48.52 ID:+DreoFMt0 Ruby には、Anemone というライブラリでスクレイピングできるけど、 これは、静的なページを対象にしているから、 5ch みたいに、空のHTML を送ってきてから、 Ajax で内容を取得するようなページには対応できない Anemone は、データベースにURL を記録して、 同じURLを再ダウンロードしないようになっているけど、 Ajax で内容を取得している場合、URLは同じでも、内容が変わっている 翌日になったら、翌日のデータを取得しているとか、 5ch では、毎回データが変わっているなど だから、こういう問題に対処するには、Ruby on Rails で、自分で作るべき でも、スクレイピングは気を付けないと、営業妨害で逮捕されるので、 同じURL は、1日1回までにすべき http://mevius.5ch.net/test/read.cgi/tech/1591334726/117
119: デフォルトの名無しさん (ワッチョイ 76c7-2CVc) [] 2020/06/22(月) 12:38:24.33 ID:fMZd4kHT0 >>117 twitterはapiなどを利用すれば情報を取れると思います そこはpythonかrubyがいいんでしょうか cmsもあったほうが便利そうなんで、組み合わせられればいいんですけど http://mevius.5ch.net/test/read.cgi/tech/1591334726/119
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.037s