[過去ログ] 2ch ブラウザ JD 20 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
575
(7): 2018/07/05(木)23:18 ID:0nhhSceu(1/2) AAS
俺も欲しいよ。
乃木坂板とか見てると、一々、画像リンクをクリックするのが面倒

でも、JD はどうせ難しい言語だろ。
他人の書いた、ソースコードを読むのは、
自分のソースコードじゃないから、何倍も時間が掛かる

Ruby 以外の言語だと、まともに動くまでが大変で、まず無理。
しかも文書が無かったら、何をやっているのか、さっぱりわからない

結論。
Ruby で、Selenium WebDriver, Nokogiri, jQuery で、
Chrome を自動操作するのが簡単
省4
577: 575 2018/07/05(木)23:27 ID:0nhhSceu(2/2) AAS
5ch のHTML 仕様は、サーバー毎に異なるだろ

仕様がめちゃめちゃって言うのが、やる気がおきない。
サーバーが増えるたびに、異なる開発者が、異なる開発をしてる

糞システム!
580: 575 2018/07/06(金)01:46 ID:NnyYQwVi(1/2) AAS
5ch の各サーバーで、使っているタグが異なる

例えば、Linux 板では、<dt <dd> のタグを使っているけど、
使っていない板もある

タグからリンクを抜き出すのにも、各サーバーで仕様が異なるから、面倒

こういう糞システムを解析する時間が膨大。
複雑で糞なほど、時間が掛かる

こういう部分はプログラミングじゃなくて、
仕様を解析しているだけだから、面白くない
583
(1): 575 2018/07/06(金)06:31 ID:NnyYQwVi(2/2) AAS
Ruby で、Selenium WebDriver で、Chrome を使って、
5ch の乃木坂板の1つのスレから、画像のURL を抜き出せた

re = /\.(jpeg|jpg|png|gif)$/i # 画像の拡張子

elements = driver.find_elements(:class => "post") # すべての投稿

elements.each do |elem|
elems = elem.find_elements(:css, "div.message > span > a")
elems.each { |e| puts e.text if re.match(e.text)} # URL
end
599
(2): 575 2018/07/07(土)07:55 ID:7S0kzh4L(1) AAS
>>585

>>583 にも書いたように、
各投稿の、div.message > span > a の、画像のURL には1つしか書いていない

サムネはないから、読み込んでいるのはその画像だけなので、
画像の通信料・データ量の節約にはならない

ImageMagick などで、画像を変換してサムネを作っているのか、
単に小さく表示しているのか、知らないけど、
大きく表示した方が、見やすいと思う
608
(1): 575 2018/07/08(日)02:20 ID:ZFuGbk0+(1) AAS
Ruby で、Selenium WebDriver で、Chrome を使うのが簡単

ブラウザを使えば、ブラウザが画像をキャッシュするから、
DB を使って、キャッシュシステムを自作しないですむ

Ruby など、可読性が高い言語でないと、開発者が集まらない。
難しい言語は、ソースコードの量が多いし、作業効率が悪いから

漏れはプロポーショナルフォントだから、文字が詰まるので読みにくい。
だから、句読点で開ける
621: 2018/07/08(日)09:53 ID:ovAs73kM(3/3) AAS
てか、2chproxy + Wine + JaneXenoが最強じゃね?
画像もスレ開くだけで全部サムネ表示してくれるし、>>575もJaneXeno使った方がいいぞ

まあ、俺もWine使わないでJDで全画像表示してくれる方がいいが
623
(1): 575 2018/07/09(月)14:31 ID:FnOUYZFA(1) AAS
>>613
C++ は暗号みたいで、可読性が低い

しかも各行に、説明も書いていない。
解読していかないといけないだろ
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.925s*