PowerShell -Part 7 (615レス)
PowerShell -Part 7 http://mevius.5ch.net/test/read.cgi/tech/1701241669/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
423: デフォルトの名無しさん [] 2025/04/26(土) 01:37:45.27 ID:1l1C1hqe ttps://pastebin.com/0HrXEMvc のHTMLソースから特定のDIVクラス「KW」とそのクラスないを削除する方法はありましでしょうか? 以下ではきえませんでした # HTML読み込み $targetDir = "D:\Download\test\sample.html" $html = Get-Content "D:\Download\test\sample.html" -Raw # KWクラスdivを正規表現で削除 $pattern = '<div\s+class="KW">[\s\S]*?<\/div>' $modifiedContent = $htmlContent -replace $pattern, '' # 結果出力 $processedHtml | Out-File "D:\Download\test\pit.html" -Encoding UTF8 http://mevius.5ch.net/test/read.cgi/tech/1701241669/423
424: デフォルトの名無しさん [sage] 2025/04/26(土) 21:00:04.39 ID:arwW7ZGW >>423 なんで変数の対応がめちゃくちゃなの? 正規表現で力技でやるとこんなところだが xmlとして読み込めばnode削除でいけそうな気がする Add-Type -AssemblyName Microsoft.VisualBasic $html = Get-Content "D:\Download\test\sample.html" -Raw # KWクラスdivを正規表現で削除 $pattern = [regex]"^((?:(?'open'<div[^>]*?>[\r\n]*))|(?'close-open'</div>)|(?:(?!</?div[^>]*>)[\s\S])+?)*(?(open)(?!))" $processedHtml=$pattern.replace($html,{ $r=$args.value $e=0 $args.groups['3'].captures| sort index| ?{$_.index+$_.length -gt $e -and $_.value -cmatch '<div.*class="KW"'}| %{$e=$_.index+$_.length; $r=[Microsoft.VisualBasic.Strings]::replace($r,$_.value,"",1,1)} $r }) $processedHtml | Out-File "D:\Download\test\pit.html" -Encoding UTF8 http://mevius.5ch.net/test/read.cgi/tech/1701241669/424
426: デフォルトの名無しさん [] 2025/04/27(日) 15:25:40.97 ID:/1DxBHsK >>425 (>>423と同一人物だよね) >>424に礼を言ったうえで、どの点が自身の質問意図に合ってなかったか説明して、 それからもっと具体的に追加質問した方がいいと思うよ。 ところで「xmlとして読み込めばnode削除でいけそう」は試してから言ってるの?何が合わなかったの? http://mevius.5ch.net/test/read.cgi/tech/1701241669/426
429: デフォルトの名無しさん [sage] 2025/04/27(日) 20:24:25.83 ID:/O0GUF2P >>426 試してませんでした HTMLやxmlを扱うことはほぼ無いのであんまり知識が無い で、>>423の場合では[xml]で読み込めてnode削除でうまくいくんだが 入れ子になってる場合 <div class="KW"> <span> <div class="KW"> </div> </span> </div> とかにはどうやったら簡単に対応できるのかと思ってるところ http://mevius.5ch.net/test/read.cgi/tech/1701241669/429
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.026s