[過去ログ]
文字コード総合スレ Part12 (1002レス)
文字コード総合スレ Part12 http://mevius.5ch.net/test/read.cgi/tech/1544931495/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
611: デフォルトの名無しさん [] 2019/09/01(日) 12:53:54.91 ID:k0czTyLP 収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて 煩雑な延命策を取らず、UTF32に完全移行すべきだった。 UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで 対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が 制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。 UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで 収録できるから、すべての文字を32ビットで表せて単純明快になる。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/611
616: デフォルトの名無しさん [] 2019/09/01(日) 13:42:43.07 ID:k0czTyLP >>612 >まずUTF-16という仕様にはサロゲートペアが最初から含まれてる あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。 変なものを作らずにUTF32を導入すべきだった。 >UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから >既に使われてるものを簡単に変えられるわけがない。 シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。 >UTF32が21bitコードになってしまったのはUTF-8のせいだ UTF8は可変長だから、32ビットでも表そう思えば表せる。 21ビットになったのはUTF16のせい。 >21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる 収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、 21ビットだけでは心許ない。 >>613 異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う 滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/616
619: デフォルトの名無しさん [] 2019/09/01(日) 14:29:25.97 ID:k0czTyLP >>618 原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。 UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、 UTF8もそれを超えるコードを規格外とみなすようにしただけ。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/619
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.032s