[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
743
(3): デフォルトの名無しさん [] 2023/02/21(火) 19:33:57.30 ID:VTx8hARX(1/2) AAS
>>740
740(1): デフォルトの名無しさん [sage] 2023/02/20(月) 21:29:57.22 ID:iLGtEctg(2/2) AAS
日本語とか中国語が特にめんどうという話は聞いたことがない。どういうこと?
UTF-8は文字によって1バイトで済むなら1バイトで表現する。

これはアルファベットを使用している欧米人には都合がいいが、漢字を使っている日本人、中国人などでは、その漢字は何バイトなのか常に意識しなくてはならなくなる。

近い将来、4バイトで統一した方が楽という話になる。
特に中国が世界の中心になると、中華人民共和国が推奨しているキャラクタセット GB2312は2バイトで一文字をあらわすキャラクタセット。

日本語のように1~2バイトで表現するから、UTF-8のように1バイト文字、2バイト文字、3バイト文字、4バイト文字、5バイト文字と何バイト使うのかわからないキャラクタセットは嫌う。

中国語EUCとUTF-8は相性が悪い。
746
(3): デフォルトの名無しさん [sage] 2023/02/21(火) 20:04:41.27 ID:NFhPk2T2(1) AAS
>>743
寝ぼけるな。
欧米でもアクセント付きの文字やちゃんとしたクォートとか使えばバイト数増える。
さらに合成アクセント、合成文字、異体字セレクタ、絵文字合成、国旗とかもろもろあって固定長にはならない。UTF32使っても可変長。
750
(1): デフォルトの名無しさん [sage] 2023/02/21(火) 20:59:48.85 ID:6Lh94JJt(1/2) AAS
うわあ「GB2312」ときたかあ
2000年以前の知識からアップデートできてないゴミ以下の化石の認識なら、
まあ>743みたいなことを言い出すのも納得だわ
当の中国政府すら「GB2312までしか対応できないようなソフトウェア製品は流通禁止」なんて言い出してから
すでに15年以上経過してるのにいったいお前はどれだけぼーっと生きてきたんだ?

>>745
745(1): 730 [sage] 2023/02/21(火) 20:03:36.31 ID:bx2YVvOk(1) AAS
みんな言うことバラバラw 結局なにが良いんだよう?
繰り返すけどBOMなしUTF8以外もはやありえない
751: デフォルトの名無しさん [sage] 2023/02/21(火) 22:10:48.02 ID:6Lh94JJt(2/2) AAS
おそらくだけど>743は知識が古すぎて
>>746が挙げてる用語がそれぞれどういう意味を持ってるのか何一つ理解できていないだろう
これでは会話が成立しない
もしくは知識があるうえで>748
748(1): デフォルトの名無しさん [] 2023/02/21(火) 20:11:40.47 ID:KCRD8vTD(1/2) AAS
>>746
UTF-32は一文字が32ビットで、4バイト単位で文字を表現するから、漢字一文字を4バイトで表現している中国のキャラクタセットと相性がいい。

UTF-8は一文字が何バイトなのかわからないから困るんだぞ?

日本語や中国語は、UTF-8だと2バイト文字というものがほぼ存在しない。

1バイト文字か3~4バイト文字の混合だったから、UTF-8よりUTF-32の方がシンプルになる。

さすがに32ビットではなく、64ビットにしようというのは、かなり未来の話だろう。
>749
749(1): デフォルトの名無しさん [] 2023/02/21(火) 20:13:32.50 ID:KCRD8vTD(2/2) AAS
>>746
話が矛盾しているぞ。UTF-8もUTF-32も同じ批判ができるなら、UTF-32の方がシンプルだろ?
みたいなことを言い出してる可能性もないわけではないが
仮にそうであったとすれば頭が悪すぎてなおのこと会話が成立しないと思われる
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.048s