[過去ログ]
文字コード総合スレ Part11 (1002レス)
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
447: デフォルトの名無しさん [] 2018/06/28(木) 23:48:15.68 ID:d1dmwFto UTF-8Nというのは だれかがテキトーにつけたUnicodeのエンコードの名前 先に結論をいうとUTF-8NはBOMついてないUTF-8ということらしいからな さらいえばUTF-8にBOMつける意味はほとんどない とりあえず概要だけ書いといてやろう BOMというのは、符号単位のオクテットの並びが リトルエディアンかビッグエンディアンか識別するためにファイルの先頭にマークされる ちなみにそれぞれのエンコードの符号単位はこんな感じなる UTF-8:1つのオクテット UTF-16:2つのオクテット UTF-32:4つのオクテット つまり、UTF-8ではそんなマークつけても意味がない オクテットが1つしかないからな、並びなんか関係ない 2つ以上の場合、オクテットの順序がリトルエディアンかビッグエンディアンかで 数値の表現のされかたが変わる CISC系のチップだと数値の表現はリトルエンディアンが多い RISC系のチップだと数値の表現はビッグエンディアンが多い つまり、CISC系のチップでリトルエディアンで保存されたファイルなら エンディアンを気にせずにファイルに保存された数値をそのまま読むことができる しかしビッグエンディアンなら一旦オクテットの並びを逆転させてから 数値を読みとる必要がある RISC系のチップならその逆になる 分かった? http://mevius.5ch.net/test/read.cgi/tech/1516629503/447
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.050s