[過去ログ] Jane Style Part157 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
360
(1): 2020/04/30(木)14:34 ID:4sNqI8uC0(3/3) AAS
001E75C0 18000000 ; = 24文字
001E75C4 外部リンク:ff5ch.syoboi.jp
001E75E4 3F000000 ; = 63文字
001E75E8 <a href="(http.+?)">(.+?)</a><span class="count"> \((\d{1,4})\)
001E7628 7E000000 ; = 126文字
001E762C 上記と同じものがUnicode16で入ってる

で鯖からのHTMLは
<li><a class="thread" href="URL">タイトル</a><span\n
class="count"> (レス数)</span><br/>\n
<a class="board" href="URL">板名</a>\n
<span class="time">スレ立て時刻</span>\n
<span class="speed2">(4 res/h)</span>\n
</li>\n
な感じ
(実際には各行頭にはスペースが幾つか挟まれてて見やすいようにインデントされてる)

ただ、正規表現を書き換えてもうまくは行かなかった
文字コードはutf-8だが、もしかすると以前はSJISだったのかも
494
(3): 2020/05/02(土)16:54 ID:Nt+kTwIo0(1/3) AAS
>>360のとこ弄って動作確認してみた
正規表現との比較がHTMLの行単位で行われてるから
class="thread" をスキップするように書き換えても </a><span の後ろがマッチングできない
<a [^>]+"(http.+?/(\d\d)\d+/)">.+?</a><([^>]+) に書き換えて $2 $3 も書き換えて試したらスレタイ span で途絶えてた
なのでレス数がどうやっても取得できない
一応
<a [^>]+"(http.+?(\d\d)/)">(.+?)</a>
にしてバッファサイズと$2$3を書き換えれば適当なレス数で一覧表示はできる
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.713s*