【保存・記録】ウェブアーカイブ総合 Page.02 (127レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) レス栞 あぼーん
40: 2024/02/25(日)02:04 ID:cjUiDYTX0(1/2) AAS
自作ツールの話だけど、DLしたデータを保存するファイル形式って何かいいのある?
例えば 外部リンク:example.com とかのURLを保存する時、
リクエストしたURL、レスポンスヘッダー、日時等のメタデータ、もちろんレスポンス本文 を保存したい。
もちろんレスポンス本文はバイナリの場合もある。
wgetだとローカルに example.com フォルダの中に blogフォルダの中に article_mode=view&page=10 というファイルを作る(半角の?はファイル名で使えないので置換される)
みたいなのがベタだと思うけど、それだとまずURL文字列の情報が失われてるし、レスポンスヘッダも消えてる。
それに1URLが1ファイルに保存されるから1サイトまるごとだとファイル数が多すぎて取り回しがしにくくなる。
warcファイルでいいやと思ったけど、一般的にはマイナーでエコシステムが力不足な事があるし
じゃあsqlteに自分でテーブルやカラムを作ってやればいいけど独自規格は後々困りそうだし…。
どうすればいいんすかね。
42: 2024/02/25(日)19:29 ID:cjUiDYTX0(2/2) AAS
うーん、それもそうか…
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.590s*