Web小説リーダーアプリ総合 ★5 (745レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

72: 名無しさん@お腹いっぱい。 警備員[Lv.6][芽] [] 2024/12/27(金)19:43 ID:KOyrlEjS(1/3)
web小説リーダーの読めなくなる直前の古いバージョンでどうにかダウンロード出来るようにならないかなって思って色々調べてみてる。
78
(1): 名無しさん@お腹いっぱい。 警備員[Lv.6][芽] [] 2024/12/27(金)20:29 ID:KOyrlEjS(2/3)
小説を読もう!オフラインリーダーのデータって基本的には本文テキストのみなんだけど、2018年以降くらいのデータは1行がhtmlのp要素に包まれてるんだけど、取り出すときにこれは自動で消した方がいいよな?

予定的にはこんな感じのフォルダ構造で出力する予定。
小説タイトルフォルダ
 ┣infoフォルダ
 ┃┗小説自体の更新情報やエピソードの更新情報など
 ┗連番付きのあらすじ・本編テキスト

テキスト自体は
ヘッダー
ページURL
ncode
シリーズURL
scode
作者ページURL
作者ID
投稿日時
更新日時

作者名
シリーズ
小説タイトル

本文

みたいな感じにしたいと思ってるけどどうだろう?
infoフォルダには小説や本文を除いたエピソードデータ、既読情報を置く予定。

意見を聞きたい。
83: 名無しさん@お腹いっぱい。 警備員[Lv.8][芽] [] 2024/12/27(金)22:27 ID:KOyrlEjS(3/3)
>>82
書き忘れていましたが、小説タイトルフォルダにはタイトル被りによる他の小説のデータ上書き防止のため手前に【ncode】が入ります。
なのでエクスプローラー上では主にncodeの文字列に従ってフォルダが並ぶはずです。

そして、あらすじ・エピソードファイルは同じくサブタイトル被り防止とソートのしやすさのために手前に000_のような連番が入ります。
この連番はWindowsのエクスプローラー以外でのソートのやりやすさを考慮して、小説の最大エピソード数の桁と同じになるように手前に0が入ります。
※エクスプローラーの場合は手前に数字が入っている場合などは1,2,3...10,100などを認識してソートして並べてくれるが他のソフトでは1,10,11...2,20,21,22などのようにならぶことがあるため。


エピソードが99以下の場合
01_subtitle.txt
09_subtitle.txt
エピソードが9999以下の場合
0001_subtitle.txt
0300_subtitle.txt
のようになります。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.262s*