2ちゃん画像落としまくりスクリプト (294レス)
上下前次1-新
1(21): 1 01/10/23 19:39 AAS
2ちゃんねるに貼ってある画像リンクを追い、
jpgをかき集めるスクリプトを作ってみました。
外部リンク:www.ninnin.net
※perlとwgetが必要です。
※Windows,Macでは動きません。
2: 01/10/23 19:49 AAS
windows で perl も wget も動くはずだが。
3: 1 01/10/23 19:50 AAS
fork 使ってるからActive perlでは動かないのですよ。
cygwin上なら動くかも(ためしてないけど)
4: 1 01/10/23 19:53 AAS
追記:
MacOS Xなら動きますよ
(10.1ならwgetを入れなきゃだめだけど)
5: 01/10/23 19:56 AAS
グロ画像コワイヨ(;´д`)
6(1): 1 01/10/23 20:03 AAS
例えばモー娘板で
一回スクリプトを実行すると
約800枚の画像が収集できます。
7: 01/10/23 21:11 AAS
UNIX板的にはどうかと思うがサンクス1
8(1): ソースコード読まずにカキコ 01/10/23 21:15 AAS
Σ(゚д゚lll)ガーン
アイドル画像板でやったら最初の画像が葉っぱ隊だった
しかも何かループしてて同じ画像だけ取ってるっぽい。
42枚しか収集できなかった。
9(1): UNIX すごい。 01/10/23 21:21 AAS
MacOS X ですがやってみました。
こんなこともできるんですね。目からウロコです。
中にはとても重たいサーバーがあるので、可能であれば
タイムアウトのパラメータも追加されるとうれしいです。
(30秒以上反応が無かったらスキップして次、など)
perl スクリプトとか詳しくないのに勝手言っちゃってすいません。
10(1): 01/10/23 21:27 AAS
cygwinのperlでも動いた。
ただ $down デフォルトは、せめて2くらいに
しておいた方が良くないかい? もしくは固定とか。
サーバに申し訳なくて5は指定出来ん。
11(1): 01/10/23 21:34 AAS
mpegも落としたいが....
醤油みたけど直すのメンドイな
12: 01/10/23 22:19 AAS
こういうのは自分で書いた方が良さげ。
13: 1 01/10/23 23:39 AAS
1です。
>>8
アイドル版ならもっと集まるはず。取得スレ数リミットをもっとあげてみよう。
>>9
wgetのパラメータをいじればできます。現在の設定は2分です。
今後調整します。スクリプトの153行目をいじれば変更もできますよ。
>>10
省3
14: 01/10/23 23:44 AAS
ガ━━(゚Д゚;)━━ソ!
よろこびいさんで半角板いったらなんもなかった
15(2): 01/10/23 23:47 AAS
おおお、すごいね。ガンガン落とせるよ。でも鯖の負荷がすごそう
なのでsage進行の方が良いかな…。
ところで、これで落とした画像を閲覧するスクリプトとか、
どうやって作るんだろう? 手動でeeで見てるんだけど、再帰的に
.jpgファイルを見るスプリプト?とかありそうなんですが。
16: 名無しさん@XEmacs 01/10/24 01:00 AAS
やっぱ wget を fork して…ってのはみんな書くのね(笑)
ウチの環境だと wget は 2 個くらい fork するのが一番
効率が良かったかなぁ。
# fork しすぎると timeout して、
# まともに取れなかったりして…
>15
find ./ -name '*.jpg' -exec display \{\} \;
省2
17(1): 01/10/24 01:08 AAS
迷惑画像URLリストとか、どこかにないでしょうか。
フィルタリングしたいですよね。
18: 01/10/24 01:26 AAS
find ./ -name '*.jpg' |xargs ElectoricEyes
19(1): 01/10/24 01:36 AAS
半角板のDATってどこにあるす? つーか何もないのはおかしいよね。
20: 01/10/24 01:41 AAS
>>15
スクリプトじゃないけどgqviewとかpicviewとかじゃだめなん?
21(1): 124 01/10/24 03:03 AAS
こんなことができるのは常時接続の人たちですか?
22: うひひ 01/10/24 09:28 AAS
>>21
情事切実な人だな。
23: 01/10/24 10:38 AAS
>>19
半角板だと
$ita = 2ch板:ascii
の設定でOKなはず
24(1): 01/10/24 13:07 AAS
http://とか
外部リンク:
みたいにあえてコピペ用になってる物も
落とせる?
25(1): 01/10/24 13:28 AAS
>>17
同意.
でも,迷惑画像っつーのは人によって異なるからね,一概には...
画像分析して妙に赤が多いのはハネるとかは欲しいかも.
26: 1 01/10/24 13:59 AAS
>>24
むろんOKです。
"ttp://"でひっかけてます。
27: 1 01/10/24 14:01 AAS
>>25
その機能はつけたいんですけどね・・・
でも赤くない死体画像もあるし・・・
こういう時に1chのレス評価システムは
使い勝手があるんだな、と感じます
28(2): 名無しさん@XEmacs 01/10/24 14:16 AAS
半角っていえば、天使とか鳥とかの半角用語?を含むURLをサポートしたスクリ
プト書いた人居る?漏れは諦めた(w
これ、できたら結構凄いよな…
29: 01/10/24 23:33 AAS
>>28
同意。ぜひ1にはがんばってもらいたい。
30(1): 名無しさん@Vi 01/10/25 01:42 AAS
たしかに画像フィルタは便利かもしれませんが、
個人的にはこのスクリプトは画像をダイジェストできることに
特化して欲しいです。
できれば追加して欲しい機能
1.URL は違うけどファイル名が同じ場合のファイル処理
2. キーワードを追加( 外部リンク:とか http外部リンク:など)
3.スレッドのスキップ(先頭から50個目のスレッドから開始など)
省3
31(1): 01/10/25 01:59 AAS
スレをどこまで読んだか記憶して、次回はそれ以降だけを読むとか、
落としたファイルのアドレスを記録しておいてそのファイルは二度と落とさないとか
そういう機能がないと、毎日同じファイルをダウンしてきてしまうと思うのですが
どうよ?
32(1): 1 01/10/25 11:38 AAS
>>30
ご意見ありがとうございます。
検討して次期バージョンに反映します。
>>31
んーと現在の仕様では、同じファイルの画像が
ローカルにあればダウンしないようになっていますので、
毎日同じファイルをダウンしてしまうというのはないです。
省2
33: 01/10/26 00:26 AAS
コレ使うとスレの荒れ度がわかるね
荒れてるスレは死体画像多い。
あとなぜかペットの画像も多いNE!
34(1): 01/10/26 05:38 AAS
wgetでいいじゃん。
35: 01/10/26 11:16 AAS
>>34
そういう説もある。
ttp://追えないけどね
36: 01/10/26 16:55 AAS
OSXにwget入れるのに小1時間かかりました。
でも成功、すごいぞUNIX、ありがとう>1
37(1): 01/10/27 01:20 AAS
>32
そっか、俺は落としてきたファイルを
別ディレクトリに移動して整理していたんだが、
そうすると、また同じやつを落としてきてしまうんだな。
死体画像とかも残しておかないと、
また同じ死体画像を落としてきてしまうのだな。
38(1): 01/10/27 10:54 AAS
>>28 その辺の隠語は限られているから、単純置換じゃダメかな…
39: 1 01/10/27 17:44 AAS
>>37
死体画像は同じファイル名でダミーのファイルとかを
置くとかすると良いかも・・・
面倒なのでそのうちその辺もなんとかしたいですね
40: 名無しさん@XEmacs 01/10/27 20:34 AAS
>38
単純置換は無理っぽいですね。隠語はちょこちょこ増えてるみたいですし、
URLは省略されたりクイズで記述されたりもするので(w
41(1): 01/10/27 20:49 AAS
おいおいおいおいおい、2ch内とはいえ下手なスパイダー
動かすのはやめてくれ。転送量も鯖の負荷も増える。
やりたいやつは公開なんかしないで、自分で作ってひっそりと
やってくれ。
42(1): 01/10/29 19:56 AAS
>>41
すいてる時間帯でもダメ?
43: 名無しさん@ほっとぞぬ 01/10/29 23:13 AAS
>>42
まず、datファイルをgetして、それを元にすればよいかと思われ。
44(3): 01/10/29 23:57 AAS
MacOSXの人って結構いるんだなぁ。
そういう漏れも。
45(2): 01/10/30 00:12 AAS
>>44
俺もMacOS X
最近多いよね。
厨房UNIX使い気取りが増えてここの板の人は迷惑だろうけど・・
46(1): 01/10/30 00:27 AAS
>>44 >>45
コンソール使う頻度はどれくらいよ?
あんまり多いのも、それはそれで考えもんだけど。
一応Macだし。
47: 01/10/30 02:34 AAS
>>44-46
スレ違い。
48(1): 01/10/30 22:21 AAS
同名のファイルがあった場合、ファイルサイズを調べて一致しなかったら
後ろに_01とか付けて保存するのは出来ませんか?
上下前次1-新書関写板覧索設栞歴
あと 246 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.009s