[過去ログ] 読めないdat落ちスレのhtmlミラー避難所 (989レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
963(1): 2006/12/02(土)18:21 ID:StO5H7q50(1/4) AAS
>>961
>htmlファイルをDLして
>htmltodatでdat化するというのはどうでしょう
htmltodatだと完全に元のdatと同じにするのは無理
964(1): 2006/12/02(土)18:27 ID:qw0Ba7Pe0(1/3) BE AAS
>>963
>完全に
とはどういうことですか?
できれば詳しくお願いします
965(2): 2006/12/02(土)18:42 ID:StO5H7q50(2/4) AAS
>>964
例えばここのテンプレの>>4の場合
>前スレ 読めないdat落ちスレのhtmlミラー作ります [87]
> 2chスレ:gline
が正しい形
それがにくちゃんねるのクソ仕様のhtmlの場合
>前スレ 読めないdat落ちスレのhtmlミラー作ります [87]
> ../../that3_gline/1115/1115213835.html
こんな形式になってやがる
これを現行のhtmltodatで戻すのは無理
省3
966: 2006/12/02(土)18:44 ID:IfRyt2KO0(1) AAS
にくちゃんねる内で完結している分には優れた形なんですけどね。
その代わりに汎用では無いと。
967: 2006/12/02(土)18:48 ID:qw0Ba7Pe0(2/3) BE AAS
>>965
素早く的確なレスをありがとうございます
なるほど、それですか…
確かに29chユーザーが随分悩まされてきた部分ですよね
968(2): 2006/12/02(土)18:52 ID:2lf4ENLR0(3/6) BE AAS
>>965
下のを試してみて下さい。
スレッドURLやbeも変換出来たと思うのですが。
正規表現(改行を取り除いて)
m#<dt>([0-9]+) 名前:<span .*?>(?:<span tit
le="(.*?)" class=sage>|<a href="mail
to:(.*?)" class=mailto>)? ?(.*) (?:</a>|</sp
an>)?</span> ?(.*?) <br><dd> *?(.*?) <br> *?<b
r> *?(<a name.*?>|</tl>|</dl>)#mi
前処理(「変換オプション」から行けます)
省12
969: 2006/12/02(土)18:58 ID:2lf4ENLR0(4/6) BE AAS
で htmltodatサポ板の書き込みで聞いたのは
前処理中の
s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(</a>)#$1http://$2\.2ch\.net/test/read\.cgi/$3/$4/$5#ig
の箇所です。
ここの「ex13」「gline」だけは欠落しているので補うしかない訳ですが
そこを半自動化出来たらいいな、と。
ただ
同じ板同じスレのhtmlを一括dat化するなら
それほど面倒でもないかもと思うですが
やはり半自動化出来ればいいな と。
970: 2006/12/02(土)19:00 ID:2lf4ENLR0(5/6) BE AAS
間違い
3行目ではなく2行目でした
s#(>)\.\./\d+?/(\d+?)\.html(</a>)#$1外部リンク:ex13\.2ch\.net/test/read\.cgi/gline/$2/$3#ig
971(2): 2006/12/02(土)19:48 ID:wrOGDRuq0(1) AAS
「2ch DAT落ちスレ ミラー変換機 ver.4」を作動した結果の「専用ブラウザ用 datファイル」の下のほうで、
にくちゃんねるのdatを右クリックで落とそうとしても、うまくDLできなくなりますた。
(makimo.to 220.254.5.211 :8000 いずれも)
ぬるぽの俺には原因がわかりません。
教えてエロい人!
972: 2006/12/02(土)19:56 ID:2lf4ENLR0(6/6) BE AAS
>>971
・・えーと
スレッドのURLを教えて頂ければ
dat化したものをアップするです
973: 2006/12/02(土)19:58 ID:qw0Ba7Pe0(3/3) BE AAS
>>971
そりゃもう無理みたいなので
htmltodatを使っちゃってください
正規表現とオプションは>>968ですかね
974: 2006/12/02(土)20:23 ID:qrBkW9yD0(1) AAS
肉はどうか知らないけど、html化の際trimしてたらどう頑張っても2chと同一のdatは復元できないよ
975: 2006/12/02(土)20:28 ID:Ec/zcph40(1) AAS
ただ、連続空白の長さが違おうがブラウザの表示は変わらない。バグってなければw
なので自分で読むだけならtrimによる差異は気にする事はないと思う。
976(1): 2006/12/02(土)20:35 ID:StO5H7q50(3/4) AAS
>>968
レスありがとうございます。
早速、いくつかのスレで試してみたのですが、
若干変換がおかしい所がありました。
外部リンク[html]:makimo.to
2chスレ:gline
の
>../1125/1125943726.html#6nを参考にdatを落として
みたいな形の場合は正常に変換できてないようです。
正常に変換できたら↓こうなるはずなのですが
省9
977(1): 2006/12/02(土)21:01 ID:StO5H7q50(4/4) AAS
あと ttp://〜 で始まる2chの過去ログ形式のURLも正常に変換できてないみたいです。
(makimo.toのhtmlの時点で既に .html.html とおかしな事になってるのが原因)
外部リンク[html]:makimo.to
2chスレ:gline
の
>73ぬるぽ:#../1158/1158680051.html.html
とか
これが元の形です
>73ぬるぽ:2chスレ:gline
s#(>)\.\./\d+?/(\d+?)\.html(?:\.html)?(?:\#)?([^<]+?)?(</a>)#$1外部リンク:ex13\.2ch\.net/test/read\.cgi/gline/$2/$3$4#ig
省2
978(1): 2006/12/03(日)10:51 ID:gY0uYykg0(1/2) AAS
3行目も変えないと駄目なのもあった。
s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(?:\.html)?(?:\#)?([^<]+?)?(</a>)#$1http://$2\.2ch\.net/test/read\.cgi/$3/$4/$5#ig
後処理は
s#\#http#ttp#ig
で、これでようやくdatが復元できたと思ったら
クソmakimo.toはAA等に 外部リンク:が含まれてるのを
#外部リンク:に変換しやがってた。
こればかりは手動じゃないと直せない、最悪。
979(2): 2006/12/03(日)12:05 ID:CDUosIpL0(1) AAS
makimo.toがないとマリョーワールドがプレイできないし
過去ログ見れないしレンジ氏ねも見れないし…
orz
980(1): 2006/12/03(日)12:32 ID:82UJZQB10(1) AAS
>>979
そこで●購入かモリタポ購入ですよw
981: 2006/12/03(日)12:35 ID:joog81WP0(1) AAS
>>980
全然笑えない。
みんなそれを鼻白んでるからこそ、
無料で過去ログを手軽に見られるための
手段を必死に話してんだろ。
982(1): 2006/12/03(日)16:06 ID:EBoOkM+U0(1/2) BE AAS
ついさっき プログラム板のhtmlを全部DLしたです
1ギガまで使えるサーバにリンクをつけてアップしたら
864メガになったですが
公開した途端に消えて後悔しても何なので暫く様子を見るです
消えるかもしれないですし。
UNIX板にもにくちゃんねる休止スレがあり、
倉庫を見ると300メガくらいなのですぐできると思うですが
この前散々叩かれたし別にいいや。
「UNIX板でwshって言われてもなぁ」とかいうのはともかく
UNIXとかわかんないですし。
省15
上下前次1-新書関写板覧索設栞歴
あと 7 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.188s*