[過去ログ] くだすれPython(超初心者用) その48【まず1嫁】 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
961(1): デフォルトの名無しさん [] 2020/07/17(金) 17:22:57.80 ID:zYg36R0O(1) AAS
>>> b=BeautifulSoup('<h1 class="ently_title">\n<a href="https://hoge.com"title=" hage記事">\nturuturu</a></h1>')
>>> b.a['href']
'https://hoge.com'
>>> b.find_all('a')[0]['href']
'https://hoge.com'
962(1): デフォルトの名無しさん [sage] 2020/07/17(金) 18:03:04.40 ID:ZI3Yj3h1(2/2) AAS
>>960
>>961
レスありがとうございます
やってみたのですがstringじゃないとエラーになりました
959はbeautifulsoupで一度h1 Tagで絞り込んだ状態です
s = soup("h1" ,class_="ently_title")
960さん961さんのやり方で絞り込むとh1Tag以外の要素を拾ってしまいます
一度絞り込んだあとで更にhrefを拾うか、最初からh1 tag,entry_title class,hrefのアドレス表示で絞り込む方法ないでしょうか?
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.048s