[過去ログ] スレ立てるまでもない質問はここで 161匹目 (1002レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
997: 2022/10/21(金)16:39 ID:X//QLN3D(1/2) AAS
次スレ
スレ立てるまでもない質問はここで 162匹目
2chスレ:tech
998: 976 2022/10/21(金)21:14 ID:X//QLN3D(2/2) AAS
>>989
Ruby のRSS::Parser で、CiNii のRDF の所のXML ファイルをパースしたら、
channel タグが無いのでパースエラーとなり、処理できない。
そこで、Nokogiri で、スクレイピングしてみた
require 'nokogiri'
file_path = "input.rdf"
doc = Nokogiri::XML( File.read file_path )
# 名前空間は、: の代わりに、| で区切る
title = doc.at_css( "dc|title" ).content
researcher = doc.at_css( "creator > Researcher > foaf|name" ).content
puts title, researcher
出力
共通性と固有性のあいだ
大向 一輝
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.035s