[過去ログ] 文字コード総合スレ Part12 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
612(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb(1) AAS
>>611611(1): デフォルトの名無しさん [] 2019/09/01(日) 12:53:54.91 ID:k0czTyLP(1/3) AAS
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。
UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。
UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。
いろいろ間違ってるなw
まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
613(1): デフォルトの名無しさん [sage] 2019/09/01(日) 13:11:25.72 ID:xmxF7u0H(1) AAS
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
614(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:35:49.57 ID:JCPxJyAV(1/2) AAS
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ
615: デフォルトの名無しさん [] 2019/09/01(日) 13:40:59.73 ID:kCJZVLuH(2/2) AAS
>>612
おまいもかなり可笑しいなω
616(1): デフォルトの名無しさん [] 2019/09/01(日) 13:42:43.07 ID:k0czTyLP(2/3) AAS
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。
>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。
シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。
>UTF32が21bitコードになってしまったのはUTF-8のせいだ
UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。
>2121(1): デフォルトの名無しさん [] 2018/12/19(水) 01:12:57.34 ID:jOXn0Ht9(5/5) AAS
ちなみipアドレスの並びはビックエンディアンになってる
ポート番号も当然ビックエンディアンになってる
ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ
ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる
ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる
bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。
>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
617: デフォルトの名無しさん [sage] 2019/09/01(日) 14:01:22.04 ID:JCPxJyAV(2/2) AAS
(もしかして: フォント)
618(1): デフォルトの名無しさん [sage] 2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH(1/2) AAS
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない
619(1): デフォルトの名無しさん [] 2019/09/01(日) 14:29:25.97 ID:k0czTyLP(3/3) AAS
>>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。
620: デフォルトの名無しさん [sage] 2019/09/01(日) 14:38:49.28 ID:5y1tL0M+(1) AAS
>>619
エンコードと文字コードを混ぜんな
おまえみたいな奴がいるから混乱するんだよ
少しは馬鹿を自覚して黙ってろ
621: デフォルトの名無しさん [sage] 2019/09/01(日) 15:12:24.21 ID:VpClr4jS(1) AAS
>>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが
622: デフォルトの名無しさん [sage] 2019/09/01(日) 15:24:13.07 ID:Cv4S4gQH(2/2) AAS
>>614
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www
623(1): デフォルトの名無しさん [sage] 2019/09/02(月) 15:56:23.21 ID:8MncpZHQ(1/2) AAS
魔法(圧力)
624: デフォルトの名無しさん [sage] 2019/09/02(月) 16:24:11.77 ID:KSSQVEnP(1) AAS
>>623
どこからの?
セブンイレブンとか?
625(1): デフォルトの名無しさん [sage] 2019/09/02(月) 22:33:53.67 ID:8MncpZHQ(2/2) AAS
マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。
626: デフォルトの名無しさん [sage] 2019/09/03(火) 00:26:14.39 ID:EcUF0HHf(1) AAS
そんな圧力あったかなあ
627(1): デフォルトの名無しさん [sage] 2019/09/03(火) 06:39:22.40 ID:KovswbEV(1/7) AAS
>>625
所でLinuxもデスクトップ環境も
一つに統一したほうが良いのではないか?ん?
628(1): デフォルトの名無しさん [sage] 2019/09/03(火) 08:49:15.73 ID:/ybqtULG(1) AAS
MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある
外部リンク:ja.wikipedia.org
629: デフォルトの名無しさん [sage] 2019/09/03(火) 10:21:51.94 ID:KovswbEV(2/7) AAS
PDFはアドビのプロプラフォーマットってイメージが抜けないw
630: デフォルトの名無しさん [] 2019/09/03(火) 10:34:53.29 ID:gWEsYspA(1) AAS
JavaだってSunのプロプラ言語だぞ
631: 667 [667] 2019/09/03(火) 12:40:23.25 ID:JzHlK+VD(1) AAS
今は違うけどね
632: デフォルトの名無しさん [sage] 2019/09/03(火) 15:04:07.63 ID:jfAsT/N5(1) AAS
そのうち「MSはUnicodeを潰すためにCP932を作った」とか言い出す奴が出てくる
633(1): デフォルトの名無しさん [sage] 2019/09/03(火) 15:40:05.81 ID:KovswbEV(3/7) AAS
Windowsの内部でCP932に依存している。
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる
634(2): デフォルトの名無しさん [sage] 2019/09/03(火) 16:56:31.60 ID:MR8tgZNH(1/2) AAS
>>627
LinuxはWindowsとは思想がほぼ真逆だからね。
多様性を重んじる。俺はそっちのほうが好きかな。
でもそれを至高とするあまり,古いカーネルや別の派生版との互換性が,Windowsのそれらに比べてない。
635(1): デフォルトの名無しさん [sage] 2019/09/03(火) 16:58:35.78 ID:MR8tgZNH(2/2) AAS
>>628
当時PDFは国際標準にこそなってなかったが,
オープンフォーマットだったし,様々な場面で使われてた。
ただ描画ソフトがクソ重たいのしかなかった記憶がw
636: デフォルトの名無しさん [sage] 2019/09/03(火) 17:26:28.25 ID:KovswbEV(4/7) AAS
>>634
だから多様性を重んじるっていうのは
競合するフォーマットが複数できるってことで
(例えば画像フォーマットや圧縮フォーマット)
Microsoftが独自フォーマットを作るのと同じ思想なんだよ
上下前次1-新書関写板覧索設栞歴
あと 366 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.016s