電子辞書 part 50 (818レス)
1-

640: 04/01(月)00:57 ID:JCAMkGnT(3/3) AAS
平凡社の大百科は見出し語9万インデックス42万らしいけれど、Wikipedia日本語は見出し語140万超。英語版に至っては680万を超えたとか。百科系は電子辞書では収容し切られないだろうな。
Wikipediaの記事の著作権はパブリックでXML形式のファイルでDLできる。GB単位の巨大テキストだけれど解析プログラム書いてインデクサーごっこ遊びはやり甲斐があるし面白いですよ。生成AIのコアデータでもあるだろうし。若い人はぜひチャレンジして見ほしいね。
1-
あと 178 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.329s*