2ちゃん画像落としまくりスクリプト (294レス)
2ちゃん画像落としまくりスクリプト http://mevius.5ch.net/test/read.cgi/unix/1003833552/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
28: 名無しさん@XEmacs [] 01/10/24 14:16 半角っていえば、天使とか鳥とかの半角用語?を含むURLをサポートしたスクリ プト書いた人居る?漏れは諦めた(w これ、できたら結構凄いよな… http://mevius.5ch.net/test/read.cgi/unix/1003833552/28
29: 名無しさん@お腹いっぱい。 [sage] 01/10/24 23:33 >>28 同意。ぜひ1にはがんばってもらいたい。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/29
30: 名無しさん@Vi [sage] 01/10/25 01:42 たしかに画像フィルタは便利かもしれませんが、 個人的にはこのスクリプトは画像をダイジェストできることに 特化して欲しいです。 できれば追加して欲しい機能 1.URL は違うけどファイル名が同じ場合のファイル処理 2. キーワードを追加( tp:// とか http:// など) 3.スレッドのスキップ(先頭から50個目のスレッドから開始など) 4. いっそのこと MPEG ファイルも対象に。 スレッドのスキップはスクリプトに追加して作ってみました。 もし希望があれば送ります。>1 http://mevius.5ch.net/t
est/read.cgi/unix/1003833552/30
31: 名無しさん@お腹いっぱい。 [sage] 01/10/25 01:59 スレをどこまで読んだか記憶して、次回はそれ以降だけを読むとか、 落としたファイルのアドレスを記録しておいてそのファイルは二度と落とさないとか そういう機能がないと、毎日同じファイルをダウンしてきてしまうと思うのですが どうよ? http://mevius.5ch.net/test/read.cgi/unix/1003833552/31
32: 1 [] 01/10/25 11:38 >>30 ご意見ありがとうございます。 検討して次期バージョンに反映します。 >>31 んーと現在の仕様では、同じファイルの画像が ローカルにあればダウンしないようになっていますので、 毎日同じファイルをダウンしてしまうというのはないです。 ただ落としたファイルのアドレスを記憶とかしてたほうが、 2回目以降の効率は良いですね。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/32
33: 名無しさん@お腹いっぱい。 [] 01/10/26 00:26 コレ使うとスレの荒れ度がわかるね 荒れてるスレは死体画像多い。 あとなぜかペットの画像も多いNE! http://mevius.5ch.net/test/read.cgi/unix/1003833552/33
34: 名無しさん@お腹いっぱい。 [] 01/10/26 05:38 wgetでいいじゃん。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/34
35: 名無しさん@お腹いっぱい。 [] 01/10/26 11:16 >>34 そういう説もある。 ttp://追えないけどね http://mevius.5ch.net/test/read.cgi/unix/1003833552/35
36: 名無しさん@お腹いっぱい。 [sage] 01/10/26 16:55 OSXにwget入れるのに小1時間かかりました。 でも成功、すごいぞUNIX、ありがとう>1 http://mevius.5ch.net/test/read.cgi/unix/1003833552/36
37: 名無しさん@お腹いっぱい。 [sage] 01/10/27 01:20 >32 そっか、俺は落としてきたファイルを 別ディレクトリに移動して整理していたんだが、 そうすると、また同じやつを落としてきてしまうんだな。 死体画像とかも残しておかないと、 また同じ死体画像を落としてきてしまうのだな。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/37
38: 名無しさん@お腹いっぱい。 [] 01/10/27 10:54 >>28 その辺の隠語は限られているから、単純置換じゃダメかな… http://mevius.5ch.net/test/read.cgi/unix/1003833552/38
39: 1 [] 01/10/27 17:44 >>37 死体画像は同じファイル名でダミーのファイルとかを 置くとかすると良いかも・・・ 面倒なのでそのうちその辺もなんとかしたいですね http://mevius.5ch.net/test/read.cgi/unix/1003833552/39
40: 名無しさん@XEmacs [] 01/10/27 20:34 >38 単純置換は無理っぽいですね。隠語はちょこちょこ増えてるみたいですし、 URLは省略されたりクイズで記述されたりもするので(w http://mevius.5ch.net/test/read.cgi/unix/1003833552/40
41: 名無しさん@お腹いっぱい。 [sage] 01/10/27 20:49 おいおいおいおいおい、2ch内とはいえ下手なスパイダー 動かすのはやめてくれ。転送量も鯖の負荷も増える。 やりたいやつは公開なんかしないで、自分で作ってひっそりと やってくれ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/41
42: 名無しさん@お腹いっぱい。 [] 01/10/29 19:56 >>41 すいてる時間帯でもダメ? http://mevius.5ch.net/test/read.cgi/unix/1003833552/42
43: 名無しさん@ほっとぞぬ [sage] 01/10/29 23:13 >>42 まず、datファイルをgetして、それを元にすればよいかと思われ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/43
44: 名無しさん@お腹いっぱい。 [] 01/10/29 23:57 MacOSXの人って結構いるんだなぁ。 そういう漏れも。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/44
45: 名無しさん@お腹いっぱい。 [] 01/10/30 00:12 >>44 俺もMacOS X 最近多いよね。 厨房UNIX使い気取りが増えてここの板の人は迷惑だろうけど・・ http://mevius.5ch.net/test/read.cgi/unix/1003833552/45
46: 名無しさん@お腹いっぱい。 [] 01/10/30 00:27 >>44 >>45 コンソール使う頻度はどれくらいよ? あんまり多いのも、それはそれで考えもんだけど。 一応Macだし。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/46
47: 名無しさん@お腹いっぱい。 [sage] 01/10/30 02:34 >>44-46 スレ違い。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/47
48: 名無しさん@お腹いっぱい。 [] 01/10/30 22:21 同名のファイルがあった場合、ファイルサイズを調べて一致しなかったら 後ろに_01とか付けて保存するのは出来ませんか? http://mevius.5ch.net/test/read.cgi/unix/1003833552/48
49: 1 [] 01/10/31 10:28 >>48 できます。 その方法も考えたのですが、結局やりませんでした。 いらないかな?と思って。 同じような要望が多ければ導入を検討します。 wgetのオプションの中にそんな機能があった気がしますので、 ご自分で改造してみてはいかがでしょう。 $optionsにオプションを突っ込んでwget実行サブルーチンを 呼んでるだけですので。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/49
50: 名無しさん@お腹いっぱい。 [] 01/10/31 13:46 試しにやってみたけどいい感じだぁよ、ありがとう。>1 要望とか考えると結局Iria先生みたくなるんだろうけど期待しちゃうよ。 なにってcronで動かしておけるから昼間だけの時限モノとか拾える可能性 あるってだけでピンコたんピキーンなれるし。 ただこの板でやるなら負荷、転送量減らしは最初に考慮する必要あるかと。 引っ越し間際のスレなんて生データで300kb以上になるのを毎回引っ張る のはやはり問題だと思うので、ツモって来たdat fileはローカルに保存して 再利用する方向で進めてはど
うか。 同名異URI処理は取り敢えず後にしないと、考え無し厨房が全開で走らせる と思われ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/50
51: 名無しさん@お腹いっぱい。 [sage] 01/11/01 19:49 ねぇねぇ、これからもいじる気ある?>1 マジでcronで走らせてグロ画像getterになろうと思うだけどいぢっていい? perl なんてしばらくいじってないから思い出すとこからはじめるけど。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/51
52: 名無しさん@お腹いっぱい。 [sage] 01/11/03 08:14 途中で切れちゃう画像とかあるんですが、どこをいじればいいですか? $limit = 3 $down = 2 で使ってますが。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/52
53: 1 [] 01/11/03 20:54 >>50 datのタイムスタンプをチェックして再利用するようにしようかなぁ ご意見ありがとう。転送量軽減を目指します。 >>51 ぜひいぢってください >>52 117行目のwgetのオプション設定で調整できると思います。 -t や -w の値を調整すると良いかも。参考ページはこちらあたりをどうぞ http://seagull.cs.uec.ac.jp/~horiuc-m/wget.html http://mevius.5ch.net/test/read.cgi/unix/1003833552/53
54: 名無しさん@お腹いっぱい。 [sage] 01/11/03 21:44 自分でSocket開いてRange: bytesヘッダとか使ってくれ。 つーかこういうもんはまともになってから公開してくれ http://mevius.5ch.net/test/read.cgi/unix/1003833552/54
55: 名無しさん@お腹いっぱい。 [] 01/11/03 22:17 FreeBSDでこのソフト使いました。 jpg/以下にたくさんのファイルがきましたが、 この中から、最適なファイルを絞り込むのはむづかしいですね。 タグ情報等から、分類できないのかなあ? もしくわ、winみたいに、一つ一つのファイルを簡単に表示 できたらまだいいかも。(サムネーム表示?) 今gimp使って、いっこいっこ開いてるけど、 もっと楽にファイル情報しらべれないかな? http://mevius.5ch.net/test/read.cgi/unix/1003833552/55
56: 名無しさん@お腹いっぱい。 [] 01/11/03 22:17 今のままじゃ、ファイル名による絞り込み しかできないよ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/56
57: 名無しさん@お腹いっぱい。 [sage] 01/11/03 22:23 ・・・ここは本当にUNIX板なのか・・・鬱 http://mevius.5ch.net/test/read.cgi/unix/1003833552/57
58: 名無しさん@お腹いっぱい。 [sage] 01/11/03 23:42 Gimp…… 絶句 http://mevius.5ch.net/test/read.cgi/unix/1003833552/58
59: 名無しさん@お腹いっぱい。 [sage] 01/11/03 23:52 つーか誰かがこのスクリプトをcronで定期的に実行して 作成されたjpglistをどっかで公開すりゃいいんだよね それを元にiriaなりwgetなりで落とせばいい そうすりゃ負荷はかからんし http://mevius.5ch.net/test/read.cgi/unix/1003833552/59
60: 名無しさん@XEmacs [] 01/11/04 00:35 >59 それおもろいね。 っつーか、 jpg をある程度の大きさごとにアーカイブしといてくれ(w ってコレはアクセスが集中してダメかにゃ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/60
61: XV [sage] 01/11/04 00:42 A.ディレクトリ毎にサムネイル表示 xv [-dir 画像があるディレクトリ] ^v ^n .xvpics ^u B.一気にサムネイル作成 cd ベースのディレクトリ find [こっちで書いてもいいし] -type d -exec mkdir {}/.xvpics \; xv [そしたらこっちもか、やっぱやめ] ^v ^e C.見ているファイルを消す 見る ^d ^d D.ファイルを移動する ^v フォーカス戻す ^v 好きなようにDnDする E.マスク外す 適当に範囲選択 f アローキーで位置変更 Shift+アローキーで範囲伸縮 拡大は Ctrl+マウス Alt+j Shift押しながらパス入力 http://mevi
us.5ch.net/test/read.cgi/unix/1003833552/61
62: 名無しさん@お腹いっぱい。 [sage] 01/11/04 00:55 >>59 2chはそれでいいかもしれんが、リスト配布はヤメとけ。 厨房に凶器与えるのと一緒だ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/62
63: 55 [] 01/11/04 14:10 >>58 さんに絶句されたんですが、 みなさんは、どうやって画像みてるのですか? マジで教えてください。 厨房なんで、すみません。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/63
64: 名無しさん@お腹いっぱい。 [sage] 01/11/04 14:36 >>63 >>61 http://mevius.5ch.net/test/read.cgi/unix/1003833552/64
65: 55 [] 01/11/04 14:52 すばらしい。感動した!有難う。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/65
66: 名無しさん@お腹いっぱい。 [] 01/11/04 16:27 グロ画像多すぎ。ホモ画像思わみてしまいかなりへこんだ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/66
67: 名無しさん@お腹いっぱい。 [] 01/11/04 18:24 Listアップするためのサーバーでも借りましょうかね。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/67
68: 名無しさん@Emacs [sage] 01/11/05 06:42 Navi2chで取得したdatを使うようにできたらうれしいな http://mevius.5ch.net/test/read.cgi/unix/1003833552/68
69: 68 [sage] 01/11/05 06:48 あ,Navi2chで m a m i して,awkで抜いて,wgetすればいいだけか… http://mevius.5ch.net/test/read.cgi/unix/1003833552/69
70: 名無しさん@お腹いっぱい。 [sage] 01/11/05 13:34 >>55 XV の Visual Schnauzer とか使うのが一般的なんじゃないの?もっとも最近 の Linux の distribution なんかには XV の入っていない例もあるようだけ ど。ちなみにわたくしは xv 3.10a に各種 patch を当てて、FLMASK とかの復 元もできるようにしたのを使ってる。Linux でも *BSD でも特に問題なくコン パイルできると思うけど? http://mevius.5ch.net/test/read.cgi/unix/1003833552/70
71: 名無しさん@XEmacs [sage] 01/11/05 22:35 XV って未だに使い方よくわかんない… メンドーなので、なんでもかんでも ImageMagick … http://mevius.5ch.net/test/read.cgi/unix/1003833552/71
72: 名無しさん@Emacs [sage] 01/11/05 23:28 >>70 既出 http://mevius.5ch.net/test/read.cgi/unix/1003833552/72
73: 名無しさん@お腹いっぱい。 [sage] 01/11/06 03:17 GQviewとか。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/73
74: 名無しさん@お腹いっぱい。 [sage] 01/11/06 03:33 キーボードマクロで+mamiするのをcronでまわしておくと、 便利というか迷惑というか。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/74
75: 名無しさん@お腹いっぱい。 [] 01/11/14 09:04 便利と思うがなんであがらないのかな? ということで定期あげ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/75
76: 名無しさん@Emacs [sage] 01/11/15 02:08 ところで、画像集めた後の話だが、 同じ様な画像がたーくさんディスクの肥しになって 欝にならないか? そんな時は、dupmerge http://people.qualcomm.com/karn/code/dupmerge/ (QualcommのPhilip Karn作) 洩れは、 find . -name "*.[GgJj][IiPp][FfEeGg]*" -o -name "*.[Mm][Pp][EeGg]*" | dupmerge みたいにして使ってるよ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/76
77: 名無しさん@お腹いっぱい。 [sage] 01/11/15 02:20 >>76 sambaでwinにmountしているんだけれども、 この手のツールはwinのほうが充実していないでしょうか。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/77
78: 名無しさん@Emacs [sage] 01/11/15 02:58 shell で書けるからね。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/78
79: 名無しさん@Emacs [sage] 01/11/15 03:02 >> 76 どうせなら iname 使え http://mevius.5ch.net/test/read.cgi/unix/1003833552/79
80: 名無しさん@Emacs [sage] 01/11/15 21:01 そりでは修正 find . -iname "*.[gjm][ip][feg]*" | dupmerge http://mevius.5ch.net/test/read.cgi/unix/1003833552/80
81: 名無しさん@Emacs [sage] 01/11/16 17:46 >>77 最近のwindowsは、ハードリンク出来るの? 消すんじゃなくてハードリンクする所が ミソなんだけど http://mevius.5ch.net/test/read.cgi/unix/1003833552/81
82: 名無しさん@お腹いっぱい。 [sage] 01/11/16 22:21 >>81 使えるわけないじゃん http://mevius.5ch.net/test/read.cgi/unix/1003833552/82
83: 名無しさん@Emacs [sage] 01/11/18 13:04 >>82 >> 77 じゃ、充実してないじゃん http://mevius.5ch.net/test/read.cgi/unix/1003833552/83
84: 名無しさん@Emacs [sage] 01/11/19 00:45 どうせ焼く時は使わない http://mevius.5ch.net/test/read.cgi/unix/1003833552/84
85: 名無しさん@お腹いっぱい。 [] 01/12/03 07:38 あげます、あげます http://mevius.5ch.net/test/read.cgi/unix/1003833552/85
86: 名無しさん@お腹いっぱい。 [] 01/12/08 08:12 お前ら、最近どうですか? http://mevius.5ch.net/test/read.cgi/unix/1003833552/86
87: 名無しさん@お腹いっぱい。 [] 01/12/08 09:57 どの板も、途中でDLが止まってしまうのだよ。なんでだ?? http://mevius.5ch.net/test/read.cgi/unix/1003833552/87
88: 名無しさん@お腹いっぱい。 [] 01/12/08 16:50 >>81-82 Windowsでもハードリンク使えるみたい CreateHardLink これをMSDNかなんかでしらべれ Unixと全く関係ないが、サゲたら忘れそうなのでアゲ http://mevius.5ch.net/test/read.cgi/unix/1003833552/88
89: 名無しさん@お腹いっぱい。 [sage] 01/12/08 17:22 FAT でどうやって hardlink 作るんだ? http://mevius.5ch.net/test/read.cgi/unix/1003833552/89
90: 名無しさん@お腹いっぱい。 [sage] 01/12/08 17:24 確か2000以降だっけかな、忘れた http://mevius.5ch.net/test/read.cgi/unix/1003833552/90
91: 名無しさん@お腹いっぱい。 [sage] 01/12/08 17:25 NTFSならhard linkもsymbolic linkもできるよ。 あんまり使われてないのはFATだと使えないからかも。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/91
92: 名無しさん@お腹いっぱい。 [sage] 01/12/08 20:07 symbolic linkをjunctionという、らしい。 ただこいつを使うと、WindowsのExplorerでさえ 摩訶不思議な挙動を示すことがあるというくらい、 ろくに使われてない機能。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/92
93: 名無しさん@お腹いっぱい。 [sage] 01/12/09 18:33 思いつきとしか思えない機能追加が多いからな。 だったら DOS のころから linkfile をサポートしといてほしい。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/93
94: 名無しさん@お腹いっぱい。 [sage] 01/12/09 20:30 DOSでFATでもハードリンク作れるYO! ただし、chkdsk.exeにクロスリンクと言われてしまう、諸刃の剣。 素人にはお勧めできない。ってやつだ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/94
95: 名無しさん@お腹いっぱい。 [] 01/12/14 22:52 こえーーー http://mevius.5ch.net/test/read.cgi/unix/1003833552/95
96: 名無しさん@お腹いっぱい。 [sage] 01/12/28 12:45 >>94 確かに間違いでは無いな(笑) http://mevius.5ch.net/test/read.cgi/unix/1003833552/96
97: 名無しさん@お腹いっぱい。 [age] 02/01/03 22:48 age て みた http://mevius.5ch.net/test/read.cgi/unix/1003833552/97
98: 名無しさん@お腹いっぱい。 [] 02/01/16 18:24 やっぱり前回履歴に対応して欲しいなぁ。 毎日cronで走らせたいヨ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/98
99: 名無しさん@お腹いっぱい。 [sage] 02/01/16 19:50 >>92 俺使ってる。でもあれってsymlinkというのは詐欺だろう。 join(DOS)とかFreeBSDのunion fs & mountみたいのと言った方が正確 かな。で、俺が見つけてる不具合は 1.Explorerやインストーラの空き容量計算がmountに対応できてないので、 インストーラで(空きがあっても)「ねーよ」と弾かれたりする 2.MoveFile() APIがmountを考慮してないので、src/destが同じドライブ 名だけど別ボリュームの場合、ファイル移動に失敗する(API直/cmd.exe Explorer全滅) だな。 一応どっちも
回避方法があるし、従来アプリは1.に対応できんというのは 仕方がない所でもあるんだが、2.はどう考えても(仕様変更への)追従ミス。 # 同一ボリューム内の移動の場合、ディレクトリエントリだけの書き換え # で高速化してるんだが、同一ボリュームかどうかの判定にsrc/destの # ドライブ文字しか見てないという。アホ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/99
100: 名無しさん@お腹いっぱい。 [] 02/01/17 20:29 100 http://mevius.5ch.net/test/read.cgi/unix/1003833552/100
101: 名無しさん@お腹いっぱい。 [] 02/01/17 20:52 ある板のある日の<a href="...">を一括表示してくれるようなサイトない? つくろうかな…。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/101
102: 名無しさん@お腹いっぱい。 [] 02/01/17 21:41 >>101 作って! http://mevius.5ch.net/test/read.cgi/unix/1003833552/102
103: 名無しさん@お腹いっぱい。 [sage] 02/01/18 09:50 >102 つくりはじめた。rawmodeを使おうかとも思ったけど、index.htmlをtidyでXHTMLに 変換してからXSLTで加工(XHTML to XML)して、XMLで日別にサーバ側に蓄積して、 CGIでXML選んでXSLTかまして(XML to HTML4)出力、みたいな感じにすることにした。 なんとなく。 とりあえず最初のXSLTまで書けましたわ。 http://mevius.5ch.net/test/read.cgi/unix/1003833552/103
104: 名無しさん@お腹いっぱい。 [] 02/01/21 06:03 age http://mevius.5ch.net/test/read.cgi/unix/1003833552/104
105: 名無しさん@お腹いっぱい。 [age] 02/01/24 01:14 >103 すばらしいあげ http://mevius.5ch.net/test/read.cgi/unix/1003833552/105
106: 101 [] 02/01/24 01:24 >>105 ども。マ板でもちょっと書いたんだけど、できました。 2ちゃんねるの 技術系/ニュース系 板の、URL流し読みサイト。 これ http://moso.borogrammers.net/newlin/ なんだけどどうかしら? 表示例↓ http://moso.borogrammers.net/newlin/read.cgi?board=news&yyyy=2002&mm=01&dd=23 http://mevius.5ch.net/test/read.cgi/unix/1003833552/106
107: 名無しさん@お腹いっぱい。 [] 02/01/28 19:58 祭り監視に良いNE >>106 http://mevius.5ch.net/test/read.cgi/unix/1003833552/107
108: 名無しさん@お腹いっぱい。 [sage] 02/01/29 00:24 >>106 面白いね ちょっと遊んでみるよ でもsage http://mevius.5ch.net/test/read.cgi/unix/1003833552/108
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 186 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.009s