[過去ログ]
★★★ビルメンテナンス(設備)Part.400★★★ (1002レス)
★★★ビルメンテナンス(設備)Part.400★★★ http://medaka.5ch.net/test/read.cgi/job/1619823523/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
885: 名無しさん@引く手あまた [sage] 2021/05/01(土) 16:43:23.13 ID:h8DFFGZ+0 PythonによるWebスクレイピングでは、requests と Beautiful Soup の2つのライブラリが定番です。requestsでHTMLをダウンロードし、Beautiful Soup で解析して情報を取り出します。 Beautiful Soup でHTMLの中からHTML要素を取得するには「find系」(find_all()、find())と「select系」(select()、select_one())という2タイプのメソッドを用います。 機能は2つとも同じであり、検索条件に合うHTML要素を返します。 異なるのは「検索条件の指定方法」です。例えば、href属性が”sample.pdf”のa要素を検索するには、それぞれ以下のような書き方になります。どちらも同じ要素を返します。 soup.find_all("a", href="sample.pdf") soup.select("a[href='sample.pdf']") このように、find_all()メソッドは「要素名」に続いて「属性」をキーワード引数で指定できます。一方、select()メソッドは、「CSSセレクタ」が使えます。 find_all()とselect()は要素をリストで返しますが、以下の表のようにマッチする要素をひとつだけ返すメソッドも用意されています。 http://medaka.5ch.net/test/read.cgi/job/1619823523/885
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 117 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.292s*