[過去ログ]
くだすれPython(超初心者用) その48【まず1嫁】 (1002レス)
くだすれPython(超初心者用) その48【まず1嫁】 http://mevius.5ch.net/test/read.cgi/tech/1589201940/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
959: デフォルトの名無しさん [sage] 2020/07/17(金) 16:57:55.10 ID:ZI3Yj3h1 beautifulsoupで抜いてきた要素からURL抜きたいんですけどTAG形式だと怒られて抜けません TAG形式からURLだけ抽出する方法教えてください <h1 class="ently_title"> <a href="https://hoge.com" title=" hage記事"> turuturu</a></h1> これをsoup.stringで抜くとNoneになり、.textで抜くとturuturuだけしか抜けません findのhrefはもちろんやってますが、途中に<br>が含まれててTAG形式には使えないと怒られます http://mevius.5ch.net/test/read.cgi/tech/1589201940/959
962: デフォルトの名無しさん [sage] 2020/07/17(金) 18:03:04.40 ID:ZI3Yj3h1 >>960 >>961 レスありがとうございます やってみたのですがstringじゃないとエラーになりました 959はbeautifulsoupで一度h1 Tagで絞り込んだ状態です s = soup("h1" ,class_="ently_title") 960さん961さんのやり方で絞り込むとh1Tag以外の要素を拾ってしまいます 一度絞り込んだあとで更にhrefを拾うか、最初からh1 tag,entry_title class,hrefのアドレス表示で絞り込む方法ないでしょうか? http://mevius.5ch.net/test/read.cgi/tech/1589201940/962
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.040s