文字コード総合スレ Part12

[過去ﾛｸﾞ] 文字コード総合スレ Part12 (1002ﾚｽ)
上下前次1-新
抽出解除ﾚｽ栞

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

293(1): デフォルトの名無しさん [sage] 2019/04/21(日)23:16:48.91 ID:oi8OpLnl(1)
ψ

611(1): デフォルトの名無しさん [] 2019/09/01(日)12:53:54.91 ID:k0czTyLP(1/3)
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。

724: デフォルトの名無しさん [sage] 2019/11/15(金)19:48:26.91 ID:CD4iEOnB(1)
文を書くときに？や（）などの半角にも全角にもある文字はどっちを使うべきなのか迷う。
数字やアルファベットは半角を使うのが普通だからASCIIコードにある文字はASCIIコードを使った方がいいんだろうか

735: デフォルトの名無しさん [sage] 2019/11/21(木)18:06:42.91 ID:oVdD3irj(2/2)
使ったこと無いからわからなかったが、全角コンマなんてのがあるんだな。
これって、全角英数と同じで、日本語の体裁に合わせるためにわざわざ作られた文字だよねぇ。

805(1): デフォルトの名無しさん [] 2019/12/05(木)16:32:04.91 ID:IbmhSLeW(1)
IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ

854: デフォルトの名無しさん [sage] 2020/02/05(水)20:43:09.91 ID:f5dE3Mu+(1)
>>853
詳しい解説サンクス

959(1): デフォルトの名無しさん [sage] 2020/06/24(水)22:24:49.91 ID:N310/pVU(1)
んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅

963(1): デフォルトの名無しさん [sage] 2020/06/26(金)20:34:46.91 ID:gjCuj5Av(1)
しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。

同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw

989(2): デフォルトの名無しさん [sage] 2020/07/01(水)22:04:25.91 ID:21fnQhh9(1)
「包摂」の概念を知らないといけないな。
「包摂文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。

「高」と「??」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.043s