[過去ログ] 【保存・記録】ウェブアーカイブ総合 Page.01 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
469
(2): GeoLog Project ◆RJRIJK3wcLw8 2020/10/11(日)16:23 ID:wq/dYYyR0(1) AAS
so-netのURL収集を始めることにしました
知っているURLがあれば追加してください
現時点でユーザー名単位で2万程度、個別URLでは300万くらいDBに入ってます

外部リンク:geolog.mydns.jp

特にJavaScript等から呼び出されるファイル群は網羅が難しいので、何か良い手があれば
470
(2): ◆sOHUy6jdA4II 2020/10/13(火)01:07 ID:y1bzU/4u0(1) AAS
>>469
日本語版ウィキペディアの外部リンクから2000個ほど抽出したんですが、スクリプトでの送信とかって受け付けてます?
(既に収集済みのものとだいぶ被りがありそうですが)
491
(1): 2020/11/22(日)08:30 ID:q2CdPGCc0(1) AAS
>>469 を使ってみた
URLをページ内検索で探したらなかったのに、送信するとDBにあると出た...
ページ内検索がダメなのかな
あと、文字化けしているところがあるけど大丈夫なのかな
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.030s