[過去ログ] 文字コード総合スレ Part12 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
293
(1): デフォルトの名無しさん [sage] 2019/04/21(日)23:16:48.91 ID:oi8OpLnl(1)
ψ
611
(1): デフォルトの名無しさん [] 2019/09/01(日)12:53:54.91 ID:k0czTyLP(1/3)
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。
724: デフォルトの名無しさん [sage] 2019/11/15(金)19:48:26.91 ID:CD4iEOnB(1)
文を書くときに?や()などの半角にも全角にもある文字はどっちを使うべきなのか迷う。
数字やアルファベットは半角を使うのが普通だからASCIIコードにある文字はASCIIコードを使った方がいいんだろうか
735: デフォルトの名無しさん [sage] 2019/11/21(木)18:06:42.91 ID:oVdD3irj(2/2)
使ったこと無いからわからなかったが、全角コンマなんてのがあるんだな。
これって、全角英数と同じで、日本語の体裁に合わせるためにわざわざ作られた文字だよねぇ。
805
(1): デフォルトの名無しさん [] 2019/12/05(木)16:32:04.91 ID:IbmhSLeW(1)
IMEの辞書とかは数学とか物理とか理系用語にめちゃくちゃ弱いイメージ
854: デフォルトの名無しさん [sage] 2020/02/05(水)20:43:09.91 ID:f5dE3Mu+(1)
>>853
詳しい解説サンクス
959
(1): デフォルトの名無しさん [sage] 2020/06/24(水)22:24:49.91 ID:N310/pVU(1)
んだからUnicodeは全角半角を再定義してるんだよ
https://ja.wikipedia.org/wiki/東アジアの文字幅
963
(1): デフォルトの名無しさん [sage] 2020/06/26(金)20:34:46.91 ID:gjCuj5Av(1)
しかし絵文字の力はすごい。
これを使いたいがために外人共もUnicodeを以前よりはるかに意識するようになってきてる。
VSとか、漢字の字形の微妙な差とかの用途より、もはや絵文字がメインユーザー。

同様なことが「文字幅」にも起きつつあるようだ。もはや東アジアだけの問題ではないのかもw
989
(2): デフォルトの名無しさん [sage] 2020/07/01(水)22:04:25.91 ID:21fnQhh9(1)
「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。

「高」と「??」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.043s