文字コード総合スレ Part11

[過去ﾛｸﾞ] 文字コード総合スレ Part11 (1002ﾚｽ)
上下前次1-新
抽出解除必死ﾁｪｯｶｰ(本家) (べ) 自ID ﾚｽ栞あぼーん

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

447: デフォルトの名無しさん [] 2018/06/28(木) 23:48:15.68 ID:d1dmwFto(1) AAS
UTF-8Nというのは
だれかがﾃｷﾄｰにつけたUnicodeのｴﾝｺｰﾄﾞの名前
先に結論をいうとUTF-8NはBOMついてないUTF-8ということらしいからな
さらいえばUTF-8にBOMつける意味はほとんどない

とりあえず概要だけ書いといてやろう

BOMというのは、符号単位のｵｸﾃｯﾄの並びが
ﾘﾄﾙｴﾃﾞｨｱﾝかﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝか識別するためにﾌｧｲﾙの先頭にﾏｰｸされる
ちなみにそれぞれのｴﾝｺｰﾄﾞの符号単位はこんな感じなる

　UTF-8：1つのｵｸﾃｯﾄ
　UTF-16：2つのｵｸﾃｯﾄ
　UTF-32：4つのｵｸﾃｯﾄ

つまり、UTF-8ではそんなﾏｰｸつけても意味がない
ｵｸﾃｯﾄが1つしかないからな、並びなんか関係ない
2つ以上の場合、ｵｸﾃｯﾄの順序がﾘﾄﾙｴﾃﾞｨｱﾝかﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝかで
数値の表現のされかたが変わる

CISC系のﾁｯﾌﾟだと数値の表現はﾘﾄﾙｴﾝﾃﾞｨｱﾝが多い
RISC系のﾁｯﾌﾟだと数値の表現はﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝが多い

つまり、CISC系のﾁｯﾌﾟでﾘﾄﾙｴﾃﾞｨｱﾝで保存されたﾌｧｲﾙなら
ｴﾝﾃﾞｨｱﾝを気にせずにﾌｧｲﾙに保存された数値をそのまま読むことができる
しかしﾋﾞｯｸﾞｴﾝﾃﾞｨｱﾝなら一旦ｵｸﾃｯﾄの並びを逆転させてから
数値を読みとる必要がある
RISC系のﾁｯﾌﾟならその逆になる

分かった？

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 1.391s*