[過去ログ]
スレ立てるまでもない質問はここで 152匹目 (1002レス)
スレ立てるまでもない質問はここで 152匹目 http://mevius.5ch.net/test/read.cgi/tech/1573214616/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
183: デフォルトの名無しさん [] 2019/12/15(日) 02:41:00.99 ID:sltsdgsx すいませんwebprog板は人がいないんでこっちで ウェブスクレイビングしてhtmlと画像を保存してます。 既に保存した画像は重複して保存しないようなデータベースを作りたいです。 つまり、pythonのset型とkey-value型を併せ持った構造にしたいんですが、どんな方法が良いでしょうか? http://mevius.5ch.net/test/read.cgi/tech/1573214616/183
184: デフォルトの名無しさん [sage] 2019/12/15(日) 03:56:12.34 ID:pFDibfNW >>183 保存する前に既に保存した画像かどうかチェックすればいいだけでは? 画像そのものでしか比較できないならダウンロードしてからハッシュで比較 テキストやURLで比較できる部分があるならそれで比較してハッシュ比較は保険 http://mevius.5ch.net/test/read.cgi/tech/1573214616/184
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.031s