[過去ログ] くだらねえ質問はここに書き込め! Part 234 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
691(1): 2019/01/22(火)09:29 ID:Xrnw4KcI(1) AAS
>>688
ASCII文字の範囲内だけなら区別できないよな
692: 2019/01/22(火)10:35 ID:kJGwNnOR(1) AAS
>>691
ASCII文字以外の範囲でも文字によっては区別できない
話は変わるけど、
Unicodeの時代になったしいまさら作ってもしょうがないだろうけど
文字コード判定で単語になってるかどうかで判定すれば
短い文字でもより精度が上がるんじゃないかって思ってる
例えば「a?‡a-?a??a?‘」とか「譁?ュ怜喧縺?」という文字化けした文字列に
出てくる単語は、世の中(例えばwikipedia)であまり使われてないが、
「文字化け」という文字列であれば登場頻度は高いからこれだろうと予測できる
単語って書いたけど各言語ごとに文字のバイト列をデータ化して
省2
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.049s