[過去ログ] 5ch ブラウザ JD 21 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
233
(2): 2018/12/02(日)19:57 ID:uwNIDeOM(1) AAS
スレタイ検索をdigにしてると検索結果が
[ Linux ] 5ch ブラウザ <strong>JD</strong> 21 ( 232 )
みたいになるけどこの<strong>タグと</strong>タグを消すにはどうしたら良いんだっけ?
ここの19スレで
> <strong>をs|</?strong>||gで消してもいいでしょう
と書いてた人がいたんだけど
これをどこにどう記述したらいいのか分からんのよね
256
(2): 2018/12/09(日)23:38 ID:HVPm1bZA(1) AAS
>>233
これ誰も答えないのはなんで?
まだ需要有るのかな?解決したかな?
258
(1): 2018/12/10(月)06:18 ID:VbWyJ3Ff(1) AAS
>>256
>>233だが難しい、スレタイとURLとレス数を抽出する正規表現の設定があるけどタグを取り除くのは無理

タグが残る原因はマッチしたタイトルをエスケープしてからhtmlパーサーに渡しているから
gitのコミットは2011年05月22日の cbd43c5e96972aadfa408dd5c86eb4310add11b7
過去スレ見ると
> スレタイ検索でタイトル中に"<"が入っているとその後の文字が消えるバグを修正しました。
2chスレ:linux

ただ、エスケープ処理をやめると<strong>にあたる部分でリンクが途切れてしまう
htmlパーサーのコード大ループ大ifelseのネストでうーん…
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.684s*