【保存・記録】ウェブアーカイブ総合 Page.02 (150レス)
上下前次1-新
1(2): 2023/11/21(火)07:23 ID:QN4SUfby0(1) AAS
ウェブアーカイブ関連の話題を総合的に扱うスレです。
情報交換し合って貴重なインターネット遺産を後世に残しましょう。
Internet ArchiveなどのWebサービスだけでなく、wget・HTTrack・Heritrix等のツールやソフト、自作クローラの話題もOKです。
・関連リンク(Rock54回避のためピリオドをカンマに変更)
Wayback Machine
外部リンク:archive,org/
archive,today
省19
70: 2024/08/13(火)23:42 ID:kQKQkOMh0(1) AAS
すでに消えていたけど
外部リンク:www.galstown.ne.jp
WaybackMachineで見る限り、消滅の予告は無かったから、ドメインとかレン鯖の期限切れかもしれない
71: 2024/08/14(水)07:08 ID:kxlIVPRz0(1) AAS
2023/12/01 更新期限を過ぎたか何かによりドメイン廃止
2024/05/31 一時凍結期間終了
外部リンク:whois-history.whoisxmlapi.com
BEアイコン:23rya.png
72: 2024/08/20(火)19:19 ID:zsZWoPkr0(1) AAS
なんだろうとTwitter見に行くもそれらしい緊急状況は無し
Temporarily Offline
Internet Archive services are temporarily offline.
Please check our Twitter feed for the latest information.
We apologize for the inconvenience.
73: 2024/08/23(金)23:31 ID:MmaR55x80(1) AAS
「牛」と呼ばれてるアーカイブサイトってどこだと思います?
探してるんだけど判らぬ……
74: 2024/08/24(土)00:45 ID:099fHmdK0(1) AAS
ソフトウェア配布サイトの事なら Tucows なんだろうけどな・・・
ちなみに同社は当該事業を終了、コンテンツは Internet Archive へ移されてる。
外部リンク:www.tucows.com
75: 2024/08/26(月)02:21 ID:B7Mket0T0(1) AAS
大手4社の資料保存活動とは? キーマンたちが現状を報告した「ゲーム開発過去資料の保存の最前線を語ろう!」レポート[CEDEC 2024]
外部リンク:www.4gamer.net
76: 2024/08/27(火)11:11 ID:ZJNuTxHU0(1) AAS
最近のサイトデザインでは折り畳みメニュー表示が増えてて実際に.orgと.todayの2つで試してみないと分からなかったりする
77: 2024/09/05(木)13:55 ID:8y13Nyfk0(1) AAS
ニューヨーク 4日 ロイター] - 米連邦控訴裁判所は、非営利団体インターネット・アーカイブが著作権保護された作品を違法にスキャンし、許可なく無料でオンライン上に公開していると訴えた大手書籍出版社4社の訴えを支持した。
マンハッタンにある連邦第2巡回区控訴裁判所は、アシェット・ブック・グループ(LAGA.PA)(新規タブ)、ハーパーコリンズ・パブリッシャーズ(NWSA.O)(新規タブ)、ジョン・ワイリー&サンズ(WLY.N)(新規タブ)、ペンギン・ランダムハウス(BTGGg.F)(新規タブ)の4社に対し、アーカイブによる書籍全体の 「大規模な 」コピーと配布は 「公正な利用 」には当たらないとの見解を示した。
78(1): 2024/10/05(土)23:37 ID:sir44IIK0(1) AAS
ぷららのホームページサービスが来年の4月1日で終了するみたい
外部リンク[html]:www.docomo.ne.jp
79: 2024/10/08(火)02:12 ID:bySj2odM0(1) AAS
無料か無料に近い形で提供されるホームページサービスは遠からず全部消えるのかなぁ
80(1): 2024/10/09(水)21:54 ID:pVxYkPnH0(1) AAS
Tor、I2P、Freenetみたいな中央サーバーを持たない、
真に匿名なネットワークでサイト運営すれば消えない
どのくらい消えないかっていうとシンプルに犯罪サイトや、
いわゆる巨悪のリーク情報なんかも永遠に残ってて、
必死こいてノイズ情報流して、せめて見つけにくくしようとしてるレベル
81: 2024/10/10(木)08:25 ID:O0Wa5OT40(1) AAS
Internet Archiveがハッキング被害、3,100万人分の個人情報流出
現在はDDoS攻撃を受けている模様
Internet Archive hacked, data breach impacts 31 million users
外部リンク:www.bleepingcomputer.com
82: 2024/10/10(木)11:25 ID:mRA5njFO0(1) AAS
始まりがあるものには、すべて終わりがある
83: 2024/10/11(金)10:59 ID:+0ZVN28A0(1) AAS
努力次第で終わりは遅延できる
84: 2024/10/11(金)14:43 ID:4/k0xNoP0(1) AAS
Googleというビッグブラザーのキャッシュ代替になったことで標的にされやすくなったんだよ
85(1): 2024/10/19(土)01:14 ID:yNdJY+Db0(1) AAS
>>80
匿名ネットでも情報は消えまくってるので消えないは幻想
結局のところ保存しておくインセンティブが無いので消える
価値のある情報は残るけどそれはクリアネットでも同じ
(現在のところ)価値が無い情報をどう保存させるかが問題
86: 2024/10/19(土)18:29 ID:7gZrEMne0(1) AAS
>>85
価値が無い情報も保存される仕組みを悪用して、
価値がある情報を悪意で埋めるのが荒らしの手口なんだけどなw
87: 2024/10/20(日)01:29 ID:YC/XYbnS0(1) AAS
IPFSだ、IPFSしかない
88: 2024/10/20(日)17:28 ID:jErutBf90(1) AAS
よく勘違いされるけどIPFSってアーカイブには向いて無いよ
あれこそ価値のある情報は残って価値がない情報は消えるシステムだよ
89: あめ ◆P0jSlC5fJs 2024/10/20(日)19:38 ID:vNuKrZxb0(1) AAS
それはそう、arweaveみたいなものではない
でも同じデータは誰が提供しても同じURLになるとか、httpよりはずっといい
歴史に残らなかったものまですべて保存は現状のハードウェアでは無理だろうし、歴史に残ったものは全部残るで十分に及第点かなぁ
90: 2024/10/23(水)01:58 ID:TBBqAAjr0(1/3) AAS
分散型はとりあえず業界の標準が決まってくれないとより良いものが出るたびにデータを投げ捨てることになりかねないな
91(1): 2024/10/23(水)13:52 ID:TBBqAAjr0(2/3) AAS
分散型ストレージのautonomiは10月29日に一般公開予定
外部リンク:docs.autonomi.com
Webサイトの公開はできるっぽいけど他の分散型プロジェクトと同様に閲覧のためにクライアントを動かさないといけないので手間
この手のプロジェクトのいいところはサイト制作者が自分で保存されることを選ぶから他者のアーカイブ行為による著作権侵害の心配がないところだね
92(1): 2024/10/23(水)14:44 ID:p8DuKr1h0(1) AAS
>>91
このプロジェクト初めて聞いたけど書いてある事が理想的過ぎて疑ってしまうな
特に1回限りの料金で永続保存のところ、Arweaveはストレージ料金が低下し続ける仮設を根拠にしてるが(これはこれでどうかと思うが)
autonomiはどういう理屈なんだろ
というかこの手のプロジェクトって何で1回限りの料金にこだわるんだろうか
分散ストレージで安いなら普通に月額でも払うが
93: [safe] 2024/10/23(水)14:56 ID:TBBqAAjr0(3/3) AAS
>>92
そうなんだよね、なんか良さげな理想並べてるけど「そんなんうまくいくのかぁ〜?」というのが正直なところ
ノードがオンライン状態でデータを保持し続ければ報酬が生成されるらしいけど、そのインセンティブを無視してノードを削除したらどうなるのか?というのがわからない
1回限りが重要なのはアップロード者が管理放棄してもデータが残るようにじゃない?
あと一応言っておくとautonomiは今年頭まではMaidsafeという名前だったけど開発18年目を迎えてリブランドしたプロジェクト
開発長過ぎるんだよなProject Xanaduほどじゃないけども
8年ぐらい前から見ててようやくローンチ迎えそうだから期待してるんだけどどうなるかなぁ・・・
94: 2024/10/28(月)05:32 ID:yhg3dtvQ0(1) AAS
ベクターHPが12月20日で終了
95: 2024/11/14(木)11:40 ID:e5vP7i/90(1) AAS
mangazも閉鎖で絶版本が無間地獄に帰るね
96: 2024/12/01(日)22:45 ID:tuRpdWYB0(1) AAS
>>78
訂正 サービス終了は来年3月31日だった
97(1): 2024/12/27(金)13:26 ID:fYcmXIUr0(1) AAS
goo IDが2017年以降ログインなしで削除
ブログが消されるかどうかは知らん
98: 2024/12/28(土)10:08 ID:xIi08uhi0(1) AAS
>>97
ID削除のソース
外部リンク:login.mail.goo.ne.jp
ブログ削除のソース
外部リンク:blog.goo.ne.jp
10年代前半で更新止まったブログは全削除されそうだな
99: 2024/12/30(月)13:37 ID:mp0Tkkna0(1) AAS
削除するぞメール来たってえきねっと退会スパムみたいなもんかと思って放置されるだろうな
100: 01/17(金)00:03 ID:0d/D0Jtj0(1) AAS
ニコニコ春画29日終了
101: 02/08(土)19:45 ID:wXhKO+uW0(1) AAS
最近は魚拓回避意図か知らんがクリックしないと表示されない系が増えてきてるけどこれ録れないよね?
coinloan.tech
102: 02/22(土)00:01 ID:1+yNfjxb0(1) AAS
【オウム真理教問題デジタルアーカイブ】
— 記憶の風化を防ぎ、次世代に記憶を継承するオウム真理教問題デジタルアーカイブサイトです。
外部リンク[html]:www.moj.go.jp
103(1): 02/26(水)17:48 ID:zrJmYLce0(1) AAS
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由
外部リンク:news.careerconnection.jp
104: 03/03(月)18:32 ID:l3vle4lQ0(1) AAS
Internet Archive総合 (web.archive.org) #6
2chスレ:esite
105: 03/04(火)14:13 ID:pZipXde+0(1) AAS
「ぷらら」の個人向けホームページが3月末に終了 古参ネットユーザー「歴史が消えていく」 - ITmedia NEWS
外部リンク[html]:www.itmedia.co.jp
106: 03/10(月)03:58 ID:AUECZsGf0(1) AAS
Internet Archive総合 (web.archive.org) #6
2chスレ:esite
107: 03/16(日)07:33 ID:kKDe6Rv/0(1) AAS
OSCHINA、スラドと OSDN の受け入れ先募集を打ち切ってサービス終了へ
外部リンク:srad.jp
スラド、継続不能になった模様
108: 03/31(月)15:37 ID:Y56lREV80(1) AAS
このスレでよく名前が挙がるArchive Teamについて
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう - Project Fx 2.0
(ドメイン名の規制回避に失敗したのでX (Twitter)の短縮リンクを貼る。カッコは消してくれ)
外部リンク:t[.]co/SgvHmY6hPA
ArchiveTeam Warriorで知識を守る - The Great Underground Home Page
外部リンク:clavis.info
109: 04/01(火)03:44 ID:3bUxAbnt0(1) AAS
ss-blogは何故かまだ生きてるな
不可視化の処理が完了するまでタイムラグがあるのか?
110: 04/04(金)09:30 ID:Ap+qSSew0(1) AAS
>>103
「熱量と情報量が凄まじい個人サイトよ、いずこに…」 2000年代にたくさんあった個人ブログ、テキストサイトが消えた理由 [851834166]
2chスレ:poverty
111: 04/04(金)22:16 ID:d/O8B0Nf0(1) AAS
外部リンク:www.fc2web.com
>FC2WEB は 2025年6月30日 (月) をもって、
サービスを終了とさせていただくこととなりました。
悪名高き?FC2ホームページとは別物で
今後はFC2ホームページに統合らしい
無料なので放置されたまま消滅するサイトも多いか
112: 04/07(月)11:32 ID:rkOq5lFK0(1) AAS
Pocketとかの代替でkarakeep(Hoarder)というのを使ってて見つけたんだけど、
Webページを単一のHTMLにしてくれるmonolithというのがなかなか良い
外部リンク:github.com
ローカル保存におすすめ
113: 04/07(月)22:58 ID:G0iokGQw0(1) AAS
こんなのあったのか
114: 04/12(土)02:39 ID:xmRuIA6s0(1) AAS
「みんなFC2WEBばっかり目が行ってるけど、実際は55 STREET、Easter、Finito Web、外部リンク:OJIJI.net、外部リンク:Zero-yen.com、外部リンク:k-free.net、GOOSIDE、KATOWEB(→KTNET)、外部リンク:ZERO-CITY.com、K-Serverも2025年6月30日に終わることになっている。 注意するんだ。」
外部リンク:x.com
115: 04/15(火)02:45 ID:5qeSSvyR0(1) AAS
WARC で保存できる Webrecorder もいいぞ
外部リンク:chromewebstore.google.com
116: 04/19(土)10:37 ID:em1R2zGM0(1) AAS
「ゲームのアーカイブ」をテーマに研究者、保存団体、社長などが一堂に会すシンポジウムが開催。ヨーロッパの博物館はゲーセンの雰囲気を再現、マイナー作品を移植するには“ドサクサに紛れてコッソリ入れ込む”──など気になるトピック多数
外部リンク:news.denfaminicogamer.jp
117(1): 05/06(火)15:07 ID:K61FRbpu0(1) AAS
archive.todayが最近不調な件
・先月中ごろから一部のサイトが取得できない
・数日前から「Not Found (yet?)」が多い
118(1): 05/07(水)06:37 ID:6n/1y+tk0(1) AAS
Not Found (yet?)はarchive.today本体が調子悪い時も取得先が調子悪い時もarchive.todayが取得先から弾かれてるだけの時も出るから本体に濡れ衣着せてしまいがちではある
特にXのセンシティブ設定されてる画像ポスト&アカウント自体が強制センシティブ設定食らってる人のポストは今のarchive.todayの仕様だとNot Found (yet?)にほぼ全部なるから、
あれ?と思ったらghost archive等の別の魚拓サイトを毎回試すようにしてる
119: 05/07(水)10:41 ID:BeikZYi90(1) AAS
Googleキャッシュの廃止以来、国内大学のレポジトリに多く上がってるPDF論文がHTML形式でアーカイブ出来なくなり悔しい…。
120: 05/07(水)11:04 ID:R8dy5vO80(1) AAS
>>117-118
Xの魚拓取ってると場合によっては(yet?)が出まくってarchive.todayがまた死にかけてる!となりがちだなw
あと保存してる最中にちょうどアカウント主が鍵かけちゃって(yet?)のページがお出しされる悲しいパターン
121: 05/21(水)19:36 ID:gBGNftSt0(1) AAS
117だが、前者の原因はIAスレ(6スレ目)のとある書き込みにあった
道理で取得できないわけか
IAだけでは心もとなくて使ってたのに、まさかそういう上限があったとは・・・
Ghostarchive、そこもそういう仕様でなければ良いが、果たして・・・
122(1): 06/07(土)08:49 ID:aN87fLV/0(1) AAS
外部リンク:www.maple.town
こんなサイトを発見
1986年からある電子掲示板のほぼ全てのログが保管されてる貴重なサイト
IDとパスワードで保護されている為archive.orgにはほとんどアーカイブされていない
しかしIDもパスワードもトップページに書かれてるので
target_username=<XXX>
target_password=<YYY>
省2
123: 06/07(土)13:52 ID:S9o9v/wR0(1) AAS
>>122
手を抜いて capture_outlinks=on も追加してしまうと、outlinks として飛んだ先では
target_username も target_password も使用されないのは盲点だった
せめて同じドメインなら認証情報も使い回してくれよw
124: 06/09(月)05:38 ID:g/YpZEvX0(1) AAS
UAの設定なんかも外部リンクには適用されないんだよな(´・ω・`)
ただcapture_allとかskip_first_archiveなんかは適用されたり
おかしなところがいくつかあったので一応
外部リンク:www.maple.town ここはリストとレス番に若干ズレがあれどちゃんと見れる
外部リンク:www.maple.town ここは前ページに遡れないなと思ったら
どうやら古いレスは消える板らしい 外部リンク:www.maple.town
でも連番でレス自体は見れるようです
125: 06/19(木)18:59 ID:lJyJlJ5s0(1/2) AAS
Ghostarchive、今朝から取得できてんだかできてないんだか
検索では取得できてることになってるが、それを見ようとすると
「An unexpected error occured: QuotaExceededError」
archive.today同様上限(同じドメインは5000件まで。Ghostarchiveではもっと少ないようだ)に引っかかったのか、それともたまたま・・・
IAだけでは心もとなくて複数のアーカイブサイトで取得するようにしてるが、結局IAしか勝たんてか
126: 06/19(木)19:34 ID:lJyJlJ5s0(2/2) AAS
訂正
archive.todayでは上限5000件までだが、もしGhostarchiveで上限があるとしたら(5000件も取得してないゆえに)それより少ないことに
127: 06/29(日)18:30 ID:V9QrwJqA0(1) AAS
125-126の件、別のブラウザで試したら取得できた
上限の問題ではないのならarchive.todayより増しなんだろうが、惜しむらくは検索が200件までしか表示されないのとブラウザによっては安定しないところか
ちなみにarchive.todayの検索はたしか3000件、IAの検索は10000件
128: 08/17(日)15:49 ID:EQLJjoS80(1/2) AAS
Sage
129: 08/17(日)15:49 ID:EQLJjoS80(2/2) AAS
Sag
130: 08/18(月)21:12 ID:ilmx9LNo0(1) AAS
閉鎖の続くブログはオワコンなのか 惜しむ声、でも保存議論は進まず:朝日新聞
外部リンク[html]:www.asahi.com
131: 10/07(火)22:06 ID:Y5oIV8NM0(1) AAS
Ghostarchive、昨日から取得できず
Archiving error
There was an issue trying to archive your webpage or video. Usually, webpages that are bigger than 50 megabytes, or videos longer than 15 minutes, may fail to archive.
You can try to archive the page again, and if it still doesn't work, report it by clicking here and we will try to rectify the issue.
↑
普段はこれが出ても一遍か二遍かやり直せば取得できるのに、何遍やり直してもこれが出る
1年前のIAのあの一件ほど長引かなければ良いが・・・
132: 10/10(金)15:51 ID:GY4PACd70(1) AAS
なぜかXだけは取得できる
道理でここ数日の記録があるわけか
外部リンク[com]:ghostarchive.org
133: 10/21(火)23:36 ID:OMBGwnIl0(1) AAS
131の件は10/11遅くに解消
その後、別の日に20分程度間隔でつながらないようなことがあったが
向こうの問題か、それともこっちがなんらかの規制に引っかかったのか・・・
134: 10/23(木)02:58 ID:SSQtUAlc0(1) AAS
アーカイブ閲覧かつ取得ができるサイト
・Internet Archive(Wayback Machine)
・ウェブ魚拓
・archive.today
・GhostArchive
以外にArquivo.ptというのがあるのか
外部リンク:arquivo.pt
省4
135: 10/30(木)03:54 ID:Ra9guvLU0(1/2) AAS
403 ERROR
The request could not be satisfied.
Request blocked. We can't connect to the server for this app or website at this time. There might be too much traffic or a configuration error. Try again later, or contact the app or website owner.
If you provide content to customers through CloudFront, you can find steps to troubleshoot and help prevent this error by reviewing the CloudFront documentation.
Generated by cloudfront (CloudFront)
Request ID: ○○(←そのとき次第)
一部だけならGhost Archive側の問題ではなく取得するサイト側の問題だろうか
136: 10/30(木)03:59 ID:Ra9guvLU0(2/2) AAS
135補足、というかこれを先に書くべきだったもの
「Ghost Archive、先ほどから一部のサイトでのことだが、取得するとこれが出る」
137(1): 11/04(火)21:17 ID:ZRIG0CTs0(1/3) AAS
fandomというサイト、どうあがいてもwebpでしか保存できなくなった・・・
138(1): 11/04(火)21:19 ID:ZRIG0CTs0(2/3) AAS
>>137
IEモードで表示すれば元のファイルで保存できたが、それも塞がれた・・・
139: 11/04(火)21:20 ID:ZRIG0CTs0(3/3) AAS
>>138
具体的には
画像が表示されず問答無用でダウンロードになる
140: 11/07(金)13:14 ID:AAADdqGF0(1) AAS
.todayはドメインレジストラTucowsにFBIが照会
141(1): 11/07(金)13:30 ID:fDrIFf260(1) AAS
FBIがウェブ魚拓サービス「archive.today」の所有者の身元を捜索中
外部リンク:gigazine.net
142: 11/07(金)16:00 ID:BMrvEZBj0(1) AAS
結局わからなさそう
143: 11/10(月)00:31 ID:PVnHVZaQ0(1) AAS
ボランティア有志が「Warrior」というソフトを使ってInternet Archiveにgooブログを保存しているんだけど、
日本国外からのアクセスが制限されててアーカイブ速度がだいぶ落ちてる
このスレを見ててWarriorを動かしてない民がいたらどうか手元でWarriorを動かしてほしい。頼む
やり方は以下の記事に書いてある。かなり簡単に導入できる。
ArchiveTeam Warriorで知識を守る(やり方) (※マウス操作による導入方法の解説)
外部リンク:clavis.info
ArchiveTeam Warriorでウェブアーカイブ活動に貢献しよう (※Dockerによる導入方法の解説。エンジニア向け)
省1
144: 11/12(水)09:19 ID:7zma6hJs0(1/2) AAS
archive.today、アクセスできないが、まさか>>141の絡みか
145: 11/12(水)10:04 ID:7zma6hJs0(2/2) AAS
144の件、先ほど復旧
146: 11/16(日)04:29 ID:HtyLo8zV0(1) AAS
Archive.todayへの疑わしい圧力に関する調査(AdGuard DNS)
外部リンク[html]:adguard-dns.io
147: 11/19(水)11:50 ID:Gld0MY4Z0(1) AAS
【お知らせ】ご利用のない無料ブログの削除について│てぃーだ スタッフブログ
外部リンク[html]:staff.ti-da.net
148: 11/20(木)17:07 ID:Erso1Nji0(1) AAS
Gooブログも結局、完全アーカイブ化は無理だったみたいだな。
某右翼政治アカウントの投稿記事はだいぶ取りそびれになってる。
149: 12/03(水)14:49 ID:fc+ybLv10(1) AAS
外部リンク:tulipplantation.com
> 突然のお知らせとなりますが、当サイトは2025年の12月31日をもちましてサービスを終了いたします。
> サービス終了に伴い、掲示板の過去ログは終了日をもってすべて削除いたします。
>(※サーバーの規約の問題により、アーカイブ公開は予定しておりません。)
150: 12/04(木)10:34 ID:6gBXC8sS0(1) AAS
外部リンク[html]:internet.watch.impress.co.jp
約30年の歴史に幕。CGIプログラム配布サイト「CGI RESCUE」、2026年3月末での終了を発表
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.424s*