[過去ログ]
【保存・記録】ウェブアーカイブ総合 Page.01 (1002レス)
【保存・記録】ウェブアーカイブ総合 Page.01 http://mevius.5ch.net/test/read.cgi/internet/1554553882/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
469: GeoLog Project ◆RJRIJK3wcLw8 [sage] 2020/10/11(日) 16:23:42.66 ID:wq/dYYyR0 so-netのURL収集を始めることにしました 知っているURLがあれば追加してください 現時点でユーザー名単位で2万程度、個別URLでは300万くらいDBに入ってます https://geolog.mydns.jp/so-net/ 特にJavaScript等から呼び出されるファイル群は網羅が難しいので、何か良い手があれば http://mevius.5ch.net/test/read.cgi/internet/1554553882/469
470: ◆sOHUy6jdA4II [sage] 2020/10/13(火) 01:07:49.82 ID:y1bzU/4u0 >>469 日本語版ウィキペディアの外部リンクから2000個ほど抽出したんですが、スクリプトでの送信とかって受け付けてます? (既に収集済みのものとだいぶ被りがありそうですが) http://mevius.5ch.net/test/read.cgi/internet/1554553882/470
491: 192.168.0.774 [sage] 2020/11/22(日) 08:30:10.87 ID:q2CdPGCc0 >>469 を使ってみた URLをページ内検索で探したらなかったのに、送信するとDBにあると出た... ページ内検索がダメなのかな あと、文字化けしているところがあるけど大丈夫なのかな http://mevius.5ch.net/test/read.cgi/internet/1554553882/491
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.029s