[過去ログ] くだすれPython(超初心者用) その48【まず1嫁】 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
959
(1): 2020/07/17(金)16:57 ID:ZI3Yj3h1(1/2)調 AAS
beautifulsoupで抜いてきた要素からURL抜きたいんですけどTAG形式だと怒られて抜けません
TAG形式からURLだけ抽出する方法教えてください

<h1 class="ently_title">
<a href="https://hoge.com"title=" hage記事">
turuturu</a></h1>

これをsoup.stringで抜くとNoneになり、.textで抜くとturuturuだけしか抜けません
findのhrefはもちろんやってますが、途中に<br>が含まれててTAG形式には使えないと怒られます
962
(1): 2020/07/17(金)18:03 ID:ZI3Yj3h1(2/2)調 AAS
>>960
>>961
レスありがとうございます
やってみたのですがstringじゃないとエラーになりました

959はbeautifulsoupで一度h1 Tagで絞り込んだ状態です
s = soup("h1" ,class_="ently_title")

960さん961さんのやり方で絞り込むとh1Tag以外の要素を拾ってしまいます

一度絞り込んだあとで更にhrefを拾うか、最初からh1 tag,entry_title class,hrefのアドレス表示で絞り込む方法ないでしょうか?
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.039s