【保存・記録】ウェブアーカイブ総合 Page.02 (127レス)
1-

1
(2): 2023/11/21(火)07:23 ID:QN4SUfby0(1) AAS
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。

・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
外部リンク:archive,org/
archive,today
省19
47: 2024/03/12(火)13:39 ID:DaYLFx9E0(1) AAS
どなたかArchiveTeamに連絡お願いします

>> このたび、ODN「ホームページサービス」につきましては、ご利用者の減少に伴い、2023年6月30日(金)に新規受付を終了し、
>> 2024年3月31日(日)をもちましてサービスを終了させていただくこととなりましたので、ご案内申し上げます。
外部リンク[html]:www.odn.ne.jp
48
(1): 2024/03/12(火)14:00 ID:kcrHEzLE0(1) AAS
個人サイトなんだけど、todayが消してくれないのどうにかならんかな。
49: 2024/03/12(火)14:24 ID:XJRNS97w0(1/2) AAS
>>48
残されて困るようなものを公開したお前が悪い
50: 2024/03/12(火)20:00 ID:rAwzeJQ40(1) AAS
長期的には.orgや.todayが潰される可能性も
51: 2024/03/12(火)21:27 ID:XJRNS97w0(2/2) AAS
.org は無いと思うが .today はわからんな
52: 2024/03/14(木)17:05 ID:4OkU93Wi0(1) AAS
.todayが重宝されてる一番の理由って日本語どころか.todayが運営してる国の言葉で正式な削除依頼を出しても突っぱねられて消えない事だからなあ
それこそ生半可な弁護士雇っても無理で某春○ちゃんの後任弁護士が英語と現地法律ガチった結果ようやく削除依頼が通ったみたいな記事書いてた気がする
53: 2024/03/14(木)21:27 ID:iPr/ZwFh0(1) AAS
スクリプト爆撃対策できない5ch自体もそろそろやばそうだ
54: 2024/03/27(水)10:00 ID:VvChnD9t0(1/2) AAS
過去の悪行をアーカイブされてる変態新聞がAI児ポに絡めてアーカイバを悪に仕立てる構図
55: 2024/03/27(水)10:47 ID:/iyhPo8d0(1) AAS
archive.is

Loading.

Not Found (yet?)

All site
56: 2024/03/27(水)16:16 ID:VvChnD9t0(2/2) AAS
.todayで俺もなった
57: 2024/04/02(火)01:43 ID:1ckoJKH40(1) AAS
2024/4/1、長年Google検索トップに鎮座していた
【文字数カウント】がODNホームページサービス終了に伴い消滅

SNSでは突然の別れに惜しむ声が絶えない
このツールは2002年から存在していた模様
画像リンク[jpg]:i.imgur.com
外部リンク[htm]:www1.odn.ne.jp

【文字数カウント】サイト閉鎖 ユーザー「一番使いやすかった」「ありがとうございました」
省1
58
(1): 2024/04/17(水)05:00 ID:LoOXS4eE0(1/2) AAS
archive.is can no longer save Twitter from around April.

example:
Twitterリンク:ifc_srh
Twitterリンク:thejimwatkins
59: 58 2024/04/17(水)05:44 ID:LoOXS4eE0(2/2) AAS
Last saved example:
外部リンク:archive.is ( Twitterリンク:ifc_srh )
Twitterリンク:thejimwatkins
60: 2024/04/18(木)16:23 ID:31KqVUKw0(1) AAS
.todayでXの保存ができなくなったか
ユーザーごとに魚拓を検索できたから重宝してたんだが
61
(1): 2024/04/19(金)04:12 ID:f+QDn1hh0(1/2) AAS
画像とかクリックして別タブで開かずそのページでポップアップみたいな感じで開くやつは
archive.org、arhive.isどちらでもアーカイブとってもクリックにその箇所が反応しないな
62
(1): 2024/04/19(金)04:29 ID:Cp941s2b0(1) AAS
>>61
archive.org の場合はサイト次第
63: 2024/04/19(金)18:52 ID:f+QDn1hh0(2/2) AAS
>>62
そうなの
MEN'S NON-NOのサイトだが画像をクリックすると、それとともに取材相手への質問が表示されるやつ
先にアーカイブとられてたやつは画像が表示されてなかったから改めてアーカイブしたら
画像表示自体はしたがクリックに無反応
64: 2024/05/21(火)04:10 ID:DF8dIwsI0(1) AAS
10年前のWebページの38%が消失──Pew Research Center調べ
外部リンク[html]:www.itmedia.co.jp

10年前のWebページの38%が消失 お前らの黒歴史も消えてるか? [156193805]
2chスレ:news
65: 2024/07/19(金)09:07 ID:i35vHi650(1/2) AAS
Sage
66: 2024/07/19(金)09:07 ID:i35vHi650(2/2) AAS
され
67: 2024/07/23(火)06:21 ID:AJUrRvmc0(1) AAS
vectorのホームページサービス終了
数々の古のフリーソフトの公式が発掘限界点の向こう側へ
68: 2024/07/23(火)23:34 ID:pbqcCg1q0(1) AAS
 
既にじゃなくて年末までか。アーカイブするしかない

《 【Webサービス】個人ホームページの歴史がまたひとつ……Vector、ホームページサービスを12月20日に終了【やじうまWatch】

2chスレ:bizplus   》

 
69: 2024/08/01(木)18:20 ID:uP7HLm9x0(1) AAS
どなたかお願いします

「アキバ総研」終了へ 22年の歴史に幕 記事は閲覧不能に - ITmedia NEWS
外部リンク[html]:www.itmedia.co.jp
70: 2024/08/13(火)23:42 ID:kQKQkOMh0(1) AAS
すでに消えていたけど
外部リンク:www.galstown.ne.jp
WaybackMachineで見る限り、消滅の予告は無かったから、ドメインとかレン鯖の期限切れかもしれない
71: 2024/08/14(水)07:08 ID:kxlIVPRz0(1) AAS
2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
外部リンク:whois-history.whoisxmlapi.com
BEアイコン:23rya.png
72: 2024/08/20(火)19:19 ID:zsZWoPkr0(1) AAS
なんだろうとTwitter見に行くもそれらしい緊急状況は無し

Temporarily Offline
Internet Archive services are temporarily offline.

Please check our Twitter feed for the latest information.

We apologize for the inconvenience.
73: 2024/08/23(金)23:31 ID:MmaR55x80(1) AAS
「牛」と呼ばれてるアーカイブサイトってどこだと思います?
探してるんだけど判らぬ……
74: 2024/08/24(土)00:45 ID:099fHmdK0(1) AAS
ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
外部リンク:www.tucows.com
75: 2024/08/26(月)02:21 ID:B7Mket0T0(1) AAS
大手4社の資料保存活動とは? キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう!」レポート[CEDEC 2024]
外部リンク:www.4gamer.net
76: 2024/08/27(火)11:11 ID:ZJNuTxHU0(1) AAS
最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする
77: 2024/09/05(木)13:55 ID:8y13Nyfk0(1) AAS
ニューヨーク 4日 ロイター] - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
78
(1): 2024/10/05(土)23:37 ID:sir44IIK0(1) AAS
ぷららのホームページサービスが来年の4月1日で終了するみたい
外部リンク[html]:www.docomo.ne.jp
79: 2024/10/08(火)02:12 ID:bySj2odM0(1) AAS
無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ
80
(1): 2024/10/09(水)21:54 ID:pVxYkPnH0(1) AAS
Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
81: 2024/10/10(木)08:25 ID:O0Wa5OT40(1) AAS
Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
外部リンク:www.bleepingcomputer.com
82: 2024/10/10(木)11:25 ID:mRA5njFO0(1) AAS
始まりがあるものには、すべて終わりがある
83: 2024/10/11(金)10:59 ID:+0ZVN28A0(1) AAS
努力次第で終わりは遅延できる
84: 2024/10/11(金)14:43 ID:4/k0xNoP0(1) AAS
Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ
85
(1): 2024/10/19(土)01:14 ID:yNdJY+Db0(1) AAS
>>80
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ

(現在のところ)価値が無い情報をどう保存させるかが問題
86: 2024/10/19(土)18:29 ID:7gZrEMne0(1) AAS
>>85
価値が無い情報も保存される仕組みを悪用して、
価値がある情報を悪意で埋めるのが荒らしの手口なんだけどなw
87: 2024/10/20(日)01:29 ID:YC/XYbnS0(1) AAS
IPFSだ、IPFSしかない
88: 2024/10/20(日)17:28 ID:jErutBf90(1) AAS
よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
89: あめ ◆P0jSlC5fJs 2024/10/20(日)19:38 ID:vNuKrZxb0(1) AAS
それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
90: 2024/10/23(水)01:58 ID:TBBqAAjr0(1/3) AAS
分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな
91
(1): 2024/10/23(水)13:52 ID:TBBqAAjr0(2/3) AAS
分散型ストレージのautonomiは10月29日に一般公開予定
外部リンク:docs.autonomi.com
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
92
(1): 2024/10/23(水)14:44 ID:p8DuKr1h0(1) AAS
>>91
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ

というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
93: [safe] 2024/10/23(水)14:56 ID:TBBqAAjr0(3/3) AAS
>>92
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?

あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
94: 2024/10/28(月)05:32 ID:yhg3dtvQ0(1) AAS
ベクターHPが12月20日で終了
95: 2024/11/14(木)11:40 ID:e5vP7i/90(1) AAS
mangazも閉鎖で絶版本が無間地獄に帰るね
96: 2024/12/01(日)22:45 ID:tuRpdWYB0(1) AAS
>>78
訂正 サービス終了は来年3月31日だった
97
(1): 2024/12/27(金)13:26 ID:fYcmXIUr0(1) AAS
goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん
98: 2024/12/28(土)10:08 ID:xIi08uhi0(1) AAS
>>97
ID削除のソース
外部リンク:login.mail.goo.ne.jp
ブログ削除のソース
外部リンク:blog.goo.ne.jp

10年代前半で更新止まったブログは全削除されそうだな
99: 2024/12/30(月)13:37 ID:mp0Tkkna0(1) AAS
削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな
100: 01/17(金)00:03 ID:0d/D0Jtj0(1) AAS
ニコニコ春画29日終了
101: 02/08(土)19:45 ID:wXhKO+uW0(1) AAS
最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね?
coinloan.tech
102: 02/22(土)00:01 ID:1+yNfjxb0(1) AAS
【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
外部リンク[html]:www.moj.go.jp
103
(1): 02/26(水)17:48 ID:zrJmYLce0(1) AAS
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
外部リンク:news.careerconnection.jp
104: 03/03(月)18:32 ID:l3vle4lQ0(1) AAS
Internet Archive総合 (web.archive.org) #6
2chスレ:esite
105: 03/04(火)14:13 ID:pZipXde+0(1) AAS
「ぷらら」の個人向けホームページが3月末に終了 古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
外部リンク[html]:www.itmedia.co.jp
106: 03/10(月)03:58 ID:AUECZsGf0(1) AAS
Internet Archive総合 (web.archive.org) #6
2chスレ:esite
107: 03/16(日)07:33 ID:kKDe6Rv/0(1) AAS
OSCHINA、スラドと OSDN の受け入れ先募集を打ち切ってサービス終了へ
外部リンク:srad.jp

スラド、継続不能になった模様
108: 03/31(月)15:37 ID:Y56lREV80(1) AAS
このスレでよく名前が挙がるArchive Teamについて

ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
外部リンク:t[.]co/SgvHmY6hPA

ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
外部リンク:clavis.info
109: 04/01(火)03:44 ID:3bUxAbnt0(1) AAS
ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか?
110: 04/04(金)09:30 ID:Ap+qSSew0(1) AAS
>>103
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
2chスレ:poverty
111: 04/04(金)22:16 ID:d/O8B0Nf0(1) AAS
外部リンク:www.fc2web.com
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。

悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
112: 04/07(月)11:32 ID:rkOq5lFK0(1) AAS
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
外部リンク:github.com
ローカル保存におすすめ
113: 04/07(月)22:58 ID:G0iokGQw0(1) AAS
こんなのあったのか
114: 04/12(土)02:39 ID:xmRuIA6s0(1) AAS
「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、外部リンク:OJIJI.net外部リンク:Zero-yen.com外部リンク:k-free.net、GOOSIDE、KATOWEB(→KTNET)、外部リンク:ZERO-CITY.com、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
外部リンク:x.com
115: 04/15(火)02:45 ID:5qeSSvyR0(1) AAS
WARC で保存できる Webrecorder もいいぞ
外部リンク:chromewebstore.google.com
116: 04/19(土)10:37 ID:em1R2zGM0(1) AAS
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”──など気になるトピック多数
外部リンク:news.denfaminicogamer.jp
117
(1): 05/06(火)15:07 ID:K61FRbpu0(1) AAS
archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
118
(1): 05/07(水)06:37 ID:6n/1y+tk0(1) AAS
Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
119: 05/07(水)10:41 ID:BeikZYi90(1) AAS
Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
 
120: 05/07(水)11:04 ID:R8dy5vO80(1) AAS
>>117-118
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
121: 05/21(水)19:36 ID:gBGNftSt0(1) AAS
117だが、前者の原因はIAスレ(6スレ目)のとある書き込みにあった
道理で取得できないわけか
IAだけでは心もとなくて使ってたのに、まさかそういう上限があったとは・・・

Ghostarchive、そこもそういう仕様でなければ良いが、果たして・・・
122
(1): 06/07(土)08:49 ID:aN87fLV/0(1) AAS
外部リンク:www.maple.town
こんなサイトを発見
1986年からある電子掲示板のほぼ全てのログが保管されてる貴重なサイト
IDとパスワードで保護されている為archive.orgにはほとんどアーカイブされていない
しかしIDもパスワードもトップページに書かれてるので
target_username=<XXX>
target_password=<YYY>
省2
123: 06/07(土)13:52 ID:S9o9v/wR0(1) AAS
>>122
手を抜いて capture_outlinks=on も追加してしまうと、outlinks として飛んだ先では
target_username も target_password も使用されないのは盲点だった
せめて同じドメインなら認証情報も使い回してくれよw
124: 06/09(月)05:38 ID:g/YpZEvX0(1) AAS
UAの設定なんかも外部リンクには適用されないんだよな(´・ω・`)
ただcapture_allとかskip_first_archiveなんかは適用されたり

おかしなところがいくつかあったので一応
外部リンク:www.maple.town ここはリストとレス番に若干ズレがあれどちゃんと見れる
外部リンク:www.maple.town ここは前ページに遡れないなと思ったら
どうやら古いレスは消える板らしい 外部リンク:www.maple.town
でも連番でレス自体は見れるようです
125: 06/19(木)18:59 ID:lJyJlJ5s0(1/2) AAS
Ghostarchive、今朝から取得できてんだかできてないんだか
検索では取得できてることになってるが、それを見ようとすると
「An unexpected error occured: QuotaExceededError」
archive.today同様上限(同じドメインは5000件まで。Ghostarchiveではもっと少ないようだ)に引っかかったのか、それともたまたま・・・
IAだけでは心もとなくて複数のアーカイブサイトで取得するようにしてるが、結局IAしか勝たんてか
126: 06/19(木)19:34 ID:lJyJlJ5s0(2/2) AAS
訂正
archive.todayでは上限5000件までだが、もしGhostarchiveで上限があるとしたら(5000件も取得してないゆえに)それより少ないことに
127: 06/29(日)18:30 ID:V9QrwJqA0(1) AAS
125-126の件、別のブラウザで試したら取得できた
上限の問題ではないのならarchive.todayより増しなんだろうが、惜しむらくは検索が200件までしか表示されないのとブラウザによっては安定しないところか
ちなみにarchive.todayの検索はたしか3000件、IAの検索は10000件
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.548s*