[過去ログ] くだすれPython(超初心者用) その48【まず1嫁】 (1002レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
959(1): 2020/07/17(金)16:57 ID:ZI3Yj3h1(1/2)調 AAS
beautifulsoupで抜いてきた要素からURL抜きたいんですけどTAG形式だと怒られて抜けません
TAG形式からURLだけ抽出する方法教えてください
<h1 class="ently_title">
<a href="https://hoge.com"title=" hage記事">
turuturu</a></h1>
これをsoup.stringで抜くとNoneになり、.textで抜くとturuturuだけしか抜けません
findのhrefはもちろんやってますが、途中に<br>が含まれててTAG形式には使えないと怒られます
962(1): 2020/07/17(金)18:03 ID:ZI3Yj3h1(2/2)調 AAS
>>960
>>961
レスありがとうございます
やってみたのですがstringじゃないとエラーになりました
959はbeautifulsoupで一度h1 Tagで絞り込んだ状態です
s = soup("h1" ,class_="ently_title")
960さん961さんのやり方で絞り込むとh1Tag以外の要素を拾ってしまいます
一度絞り込んだあとで更にhrefを拾うか、最初からh1 tag,entry_title class,hrefのアドレス表示で絞り込む方法ないでしょうか?
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.039s