[過去ログ] くだすれPython(超初心者用) その48【まず1嫁】 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
959
(1): デフォルトの名無しさん [sage] 2020/07/17(金) 16:57:55.10 ID:ZI3Yj3h1(1/2) AAS
beautifulsoupで抜いてきた要素からURL抜きたいんですけどTAG形式だと怒られて抜けません
TAG形式からURLだけ抽出する方法教えてください

<h1 class="ently_title">
<a href="https://hoge.com"title=" hage記事">
turuturu</a></h1>

これをsoup.stringで抜くとNoneになり、.textで抜くとturuturuだけしか抜けません
findのhrefはもちろんやってますが、途中に<br>が含まれててTAG形式には使えないと怒られます
960
(1): デフォルトの名無しさん [sage] 2020/07/17(金) 17:03:51.82 ID:cu+Ver0E(1) AAS
>>959
↓みたいなかんじーで、https://hoge.comが出れば成功。
for aa in soup.find_all("a"):
____hoge = aa.get("href")
____print(hoge)
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.036s