[過去ログ]
Regular Expression(正規表現) Part15 (1002レス)
Regular Expression(正規表現) Part15 http://mevius.5ch.net/test/read.cgi/tech/1568640311/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
402: 400 [sage] 2020/09/21(月) 02:18:58.27 ID:+seX53Ud 別に抜き出すだけなら、 一旦、</a> の後ろに、改行を追加してから、正規表現を使えば? それか、HTML をコピーしてから、やるとか http://mevius.5ch.net/test/read.cgi/tech/1568640311/402
405: 400 [sage] 2020/09/21(月) 05:27:30.09 ID:+seX53Ud Ruby, Nokogiri で、スクレイピングしたら、 require 'open-uri' require 'nokogiri' # プログラム技術@スレッド一覧 url = "https://mevius.5ch.net/tech/subback.html" doc = Nokogiri::HTML( open( url ) ) # 「言語」という単語が含まれる、タイトルを表示する ary = doc.css( "#trad > a" ).map { |elem| elem.content } .select { |title| title.include? "言語" } puts ary 出力 6: 次世代言語21 Go Nim Rust Swift Kotlin TypeScript (330) 10: 日本語プログラミング言語『なでしこ』スレ6.1c2ch.net (108) 以下略 http://mevius.5ch.net/test/read.cgi/tech/1568640311/405
408: 400 [sage] 2020/09/21(月) 22:36:13.18 ID:+seX53Ud >>405 のopen-uri を、下のように、外部コマンドのcurl にも出来るけど、 普通は、わざわざ外部コマンドを呼ばない url = "http〜" doc = Nokogiri::HTML( open( url ) ) html = `curl http〜` doc = Nokogiri::HTML( html ) http://mevius.5ch.net/test/read.cgi/tech/1568640311/408
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.044s