[過去ログ] スレ立てるまでもない質問はここで 152匹目 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
183(1): 2019/12/15(日)02:41 ID:sltsdgsx(1) AAS
すいませんwebprog板は人がいないんでこっちで
ウェブスクレイビングしてhtmlと画像を保存してます。
既に保存した画像は重複して保存しないようなデータベースを作りたいです。
つまり、pythonのset型とkey-value型を併せ持った構造にしたいんですが、どんな方法が良いでしょうか?
184(1): 2019/12/15(日)03:56 ID:pFDibfNW(1) AAS
>>183
保存する前に既に保存した画像かどうかチェックすればいいだけでは?
画像そのものでしか比較できないならダウンロードしてからハッシュで比較
テキストやURLで比較できる部分があるならそれで比較してハッシュ比較は保険
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.027s