Internet Archive総合 (web.archive.org) #6 (657レス)
1-

1
(2): 絵文字糖質はスルー推奨 2024/12/04(水)14:10 AAS
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
外部リンク:archive.org

インターネット・アーカイブ - Wikipedia
外部リンク:ja.wikipedia.org
 ------------------
X (旧Twitter)
省11
577: 06/08(日)04:18 AAS
>>576
うわーほんとだありがとう
外部リンク[html]:web.archive.org
まだ表示できない状態だけど保存操作はできた
HEAD リクエスト弾き対策で force_get はオンにしてみることはあるけど
意図してエラーページを保存しようとしない限り capture_all は外すよね
578: 06/09(月)00:46 AAS
保存はできてもアーカイブへのリンクが機能するまでがえらい遅れてる
579: 06/11(水)20:08 AAS
この手のサービスってマジで意味ないな
検索エンジンもAIのdeep researchもarchive.orgなんか検索対象にしないから
過去に存在して消えたサイトが数十年後に他人の役に立つなんて事がない
ただゴミ屋敷住人のオナニーでしかない
580: 06/11(水)20:12 AAS
指定すればリサーチしてくれるで
ちょっと前にそれ参考にしてやってくれってしたことあるわ
581: 06/11(水)22:10 AAS
>>548
これと同じでhttpsだとエラーページが出るのだけどたまにhttpがきちんと保存されることがある
どちらが保存されるかはタイミング次第としか言えなくて完全に謎
582: 06/12(木)23:05 AAS
ほんとだ HTTP 行けることあるみたいですね
BEアイコン:255re.png
583
(2): 06/15(日)22:23 AAS
旧FC2 Web、なかなかWarriorでの保存が始まらないな
外部リンク:wiki.archiveteam.org
584
(1): 06/16(月)09:21 AAS
>>583
たしかに
先週あたりにドメインごとの検索ページとランキングページ提示したら「これをwarriorで動かす予定」と言ってくれたんだけどな
検索結果のurlとランキングページ全てtxtにまとめるべきかな?
585: 06/16(月)23:04 AAS
>>584
どうなってるか訊いてみた方がいいかもしれん
我々が出来ることもあるかもしれないし
586
(1): 06/19(木)09:59 AAS
goo辞書のプロジェクトが始まったようです
外部リンク:tracker.archiveteam.org
587: 06/19(木)12:53 AAS
それ思いっきり三省堂とかの著作権侵害じゃねえの
588: 06/19(木)12:55 AAS
それいったら他のアーカイブもだけど…
589: 06/19(木)13:01 AAS
そもそも企業のweb辞書に使われてるのはそういうのOKにしてる物だけだったような
590: 06/19(木)16:29 AAS
最近著作権がどうたらのレス多いね
アーカイブしてるのならその辺は理解した上でやってると思ってたんだが
591: 06/19(木)16:39 AAS
ただの構って欲しい奴だよ
592
(1): 06/20(金)02:44 AAS
Twitterの動画っていつの間にか取れなくなってたのか
593
(1): 06/20(金)08:28 AAS
>>592
その動画のURLが分かれば取れる
594: 06/20(金)16:42 AAS
>>593
いや直URLでも再生出来なくなってる
595
(1): 06/20(金)20:10 AAS
いつ頃からよ?
外部リンク[mp4]:web.archive.org
596
(1): 06/21(土)03:35 AAS
gooブログの保存プロジェクトは
597: 06/21(土)03:53 AAS
>>596
プロジェクトは…なに?
まあfc2より終了まで時間あるけど
598: 06/22(日)01:30 AAS
>>595
今やったら保存できたわ
599
(3): 06/22(日)15:26 AAS
>>583
FC2 Webがまだ始まってなくて心配
サイトの規模的に2, 3日前からでは間に合わない気がするんだが…
600
(1): 06/22(日)16:41 AAS
>>599
普通に始まってね?
外部リンク:tracker.archiveteam.org
601
(1): 599 06/22(日)23:02 AAS
>>600
それはFC2の旧サービスの方だと思う(6月頭にサ終済み)
外部リンク:wiki.archiveteam.org
確かにtracker上ではまだクローラが動いてるんだが、もうサ終してるのでwarriorは無を保存し続けてる

自分が意図してたのは同じFC2でもホームページホスティングサービスの方。こっちは6月30日まで
外部リンク:wiki.archiveteam.org
602: 06/23(月)02:38 AAS
そんな風に同じと勘違いされてるとか?
603
(1): 06/23(月)14:31 AAS
>>601
trackerを見る限り普通にfc2WebのURLが流れてるように見えるんだけど、それとは違うの?
604: 599 06/23(月)15:10 AAS
>>603
本当だ。今確認したら確かにfc2webが流れてた
自分が昨日見た時は流れてなかったと思ったんだが、何か勘違いしてたかもしれない
すまんかった

でもwarriorで始まってるなら良かった
605
(1): 06/23(月)22:23 AAS
ヤフーニュースのコメントを見たいのに記事は何で1週間か下手すりゃ数日ですぐ消すん?あれじゃ熱心にコメント書いてる人達も意味ないぞ
606: 06/24(火)00:22 AAS
読者層の程度に見合った期間w
607: 06/24(火)00:26 AAS
その日数が経てば忘れるってことだろ
ニュースなんて本当はその程度の価値しかないんだよ
608: 06/24(火)11:50 AAS
ヤフーの記事はただ掲載期間を決めて載せてるからだろ、期間が短いのもあれば長いのもあるてだけ
609: 06/24(火)19:20 AAS
まぁコメントは残してほしいよな、ニコニコニュースとかは残してる
ヤフコメとは言え当時の貴重な反応なのにな
610
(1): 06/25(水)09:42 AAS
gooちゃん後もう時間か享年25歳
ここん所どこも属人化しててサービス続けられなくてどうして良いか分からんのかな
歩く仕様書みたいなやつが居るし居なくなったらシステムも終わりって感じ
611: 06/25(水)11:24 AAS
単純にPVがなくなっただけじゃないか
みんなSNSやらYoutubeやらのプラットフォームに夢中
検索して見るのはまとめサイト
これじゃ存続できないよ
612: 06/25(水)18:38 AAS
fc2webのジョブがtrackerに流れてこなくなった
終わったのか?
613: 06/25(水)21:25 AAS
>>586
えあれも保存するんだ
614: 06/25(水)21:28 AAS
>>605
そういうのは5ch2ch及びそのまとめの受け持ちなんじゃね
yahooはアカウント育成が本題のような
615: 06/25(水)21:34 AAS
>>610
シンプルにしておかないと属AI化が不可逆的に進行しそう
本体のデータが損壊しない限りやりようはあると思うが
現状誰と誰がどこにご本尊のデータ置いとくかすらあやふやなのがな
616: 06/26(木)21:27 AAS
gooサービス終了一覧

・gooニュース  : 2025年6月18日(水)終了
・goo辞書     : 2025年6月25日(水)終了
・教えて!goo   : 2025年9月17日(水)終了
・gooランキング : 2025年9月30日(火)終了
・goo blog    : 2025年11月18日(火)終了
・gooメール    : 2026年2月25日(水)終了
617: 06/27(金)04:18 AAS
goo blogはランキングやサイトマップ以外にタグから集めることもできるね
外部リンク:blog.goo.ne.jp
上限908ページでそれ以上は見切れる(新しい順だから古いものが見切れる。逆に言えば908に満たない場合最古まで見れる)
ページ内に関連タグがけっこうあるので軽く20個のタグ内で他のタグ集めてみたら2万も集まった
たまに壊れてるページがあるのが厄介だな。例えば#物理とか5ページ目くらいで「・該当する記事はありません。」と出るけど実際は200ページ以上ある
あとはアクセスランキングの下の方がよく回るから定期的に確認したり
618: 06/29(日)16:14 AAS
未だにGoogleの検索結果でgoo辞書が出てくるのが泣ける
インターネット・アーカイブで見に行くと、なるほど全部保存されてるんだな
619: 06/30(月)06:48 AAS
100年くらい経ったらタネアカも無形文化遺産とかに指定されるのかな
620: 06/30(月)13:58 AAS
6/30までだから23:59までかと思ったら終わってた
621: 07/02(水)00:32 AAS
教えてgooってアーカイブできるのかな
gooblogもテキストしかうまく保存できないとしてもアーカイブないよりはいいし
622: 07/02(水)11:08 AAS
優先順位高いのはやっぱり教えてgooとgoo blogかな
archiveteam wikiにはまだ情報が出ていないから連絡する必要があるかも?
623: 07/02(水)11:16 AAS
教えてgooって同じ質問と解答が昔から複数サイトで引っかかるから連動してるっぽいけど源流が教えてgooなん?
624: 07/02(水)12:12 AAS
>>411に詳細がある
625: 07/02(水)13:11 AAS
なるほど、別物になったのか
使う人どれくらいいたんだろ
626
(2): 07/03(木)11:13 AAS
ここで聞いていいことなのかわかりませんが

2018年ころに消えたyoutube動画のコメントをwaybackmachineで読みたくてURLを探しています。
動画自体は他にもupされているのでコメントだけ保存されていればいいです。

動画の正確なタイトルは覚えていませんが、英語で特定のワードがいくつか含まれていたのは確実です。

waybackmachineで検索しても見つかりません。(そもそもhit数が数十件しかありません。かなり有名なワードなので奇妙です)
数十万再生くらいはあったので保存はされているはずです。

なにか上手い探し方はないでしょうか。
627: 07/03(木)11:22 AAS
あれ仕組み的に保存できんでしょ
628: 07/03(木)18:55 AAS
Archive Teamのwikiが正しければ2018年のコメントは保存されてないと思う
外部リンク:wiki.archiveteam.org

archive todayにワンチャン残ってる可能性がある位かな
629
(1): 626 07/04(金)00:14 AAS
すいません、どういうことですか
630: 07/04(金)03:11 AAS
5chの重いページを保存しようとするとfavicon.icoになって保存できない
2chスレ:anime2
2chスレ:youth
外部リンク:kako.5ch.net
なにかいい方法ないかな
631: 07/04(金)07:45 AAS
>>629
internet archiveの保存の仕組み的に
コメントは保存されていない可能性が高い
archive todayという別のサイトでワンチャン保存されているかも…くらいで
当時のコメントを見れる可能性は低い
632: 07/04(金)12:23 AAS
ちょっと前までseesaawikiをWBで検索すると謎にクラッシュしてたんだが、いつの間にか直ってるな
633
(1): 07/04(金)12:24 AAS
ブラウザがクラッシュ?サイトがエラー?どっちだ?
634: 626 07/05(土)08:44 AAS
おお…マジですか…残念だ

ありがとうございます
635: 07/06(日)06:07 AAS
UNIVERSALとSMEがSP音源の著作権で提訴したよな
続報知ってる人いる?
636: 07/07(月)12:47 AAS
>>633
昔はseesaawikiをWaybackに入れてカレンダーを見ようとするとサイトがエラー起こしてた(Reportボタンが表示されるページになる)
637: 07/09(水)15:10 AAS
10月に1兆アーカイブに届くって予想してるらしい(これで届かなかったら面白い)
外部リンク:blog.archive.org
638: 07/12(土)12:20 AAS
今更ではあるが未だにonion版に繋がらないのだが、ひょっとして去年のサイバー攻撃の影響でサ終した感じ?
639: 07/12(土)12:20 AAS
今更ではあるが未だにonion版に繋がらないのだが、ひょっとして去年のサイバー攻撃の影響でサ終した感じ?
640: 638&639 07/12(土)12:24 AAS
アレ?何故か連投されちゃってる。
スマホブラウザでのプライバシーモードがイカンかったか…
スレ汚しスマソ
641
(1): 07/12(土)16:19 AAS
onion版とは
642: 07/12(土)17:39 AAS
>>641
外部リンク:archive.is
643: 07/13(日)22:15 AAS
最近はAI対策か閲覧時に人間認証が入るサイトが増えてきた
644
(1): 07/13(日)23:56 AAS
コトバンクの操作性が思った以上に悲惨で泣ける
場合によってはgoo辞書をWayback Machineから呼び出したほうがマシなくらいだ
全ページ保存してくれた人たちに感謝だぜ
645: 07/20(日)01:24 AAS
Amazon の商品ページが Wayback Machine で保存できなくなった

外部リンク:imgur.com

"下のボタンをクリックしてショッピングを続けてください"
(実際は UTF-8 が Shift_JIS で表示されて読めない「荳九…」)

"Click the button below to continue shopping"
646: 07/20(日)11:36 AAS
>>644
わかる
647: 07/21(月)13:24 AAS
todayでもpixivが安定して取れなくなってしまった。前は複数枚投稿も全部取れたんだが今は画像の欠落が多い
648: 07/21(月)21:55 AAS
Pixivだと成年向けページはログイン必須になるんで元から魚拓取る方法が無いよな…。
 
DLsiteも同じく
 
649: 07/27(日)01:23 AAS
pdfはCommon Crawlが収集してるとカレンダー上では青色でも中身はエラーになってる時あるな
>>557のサイズ制限の影響かな?
650: 07/28(月)22:32 AAS
Internet Archiveがアメリカの連邦政府刊行物寄託図書館に指定されたことで何が変わるのか?
外部リンク:gigazine.net
651: 07/29(火)23:20 AAS
でもGIGAZINEはIA除外設定してるよね
652: 07/31(木)16:23 AAS
Save Page Now could not capture this URL because it was unreachable. If the site is online, it may be blocking access from our service.

なんかやたらこのエラーが出る
653: 07/31(木)16:38 AAS
IAのクローラをブロックしてるサイトも多いからね
ギガジンみたいにバックナンバー有料にしてるとこは勝手に過去ページ読まれたら商売あがったりだし
654: 07/31(木)19:00 AAS
文章だけ取りゃいいなら色々方法はある
655: 08/02(土)08:18 AAS
Googleストリートビューとか
Google Earthをアーカイブする方法ないだろうか?
発展と衰退を残したり
故郷が変わっていく変遷とか
残せると良いと思うんだけど…
多分IAの仕様上厳しいか?
656: 08/03(日)18:20 AAS
cloudflareとかのddosブロック系は突破できるようになってくれないかなぁ
657: 08/04(月)18:30 AAS
蔓延り出したが運の尽きに…
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.138s*