[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
868
(1): デフォルトの名無しさん [sage] 2023/02/27(月) 00:05:34.15 ID:Y3EgytEI(1/7) AAS
リンク貼った人がいるので正解は
Microsoft の主張は「WEBの標準はASCIIと互換性のある BOM 無しの UTF-8 だから、それに合わせるため変更した。これは重要な改善である。後方互換性のためにBOMつきも可能にしといた」

BOMなしは改善、BOMつき後方互換性って明言してる。
882: デフォルトの名無しさん [sage] 2023/02/27(月) 10:24:39.27 ID:Y3EgytEI(2/7) AAS
外部コードは自動認識うんぬんより ASCII との互換性が重要なのだ
Linux だの Mac だのの Unix 系は ASCII との互換性が必須なので BOM 無し UTF-8 以外に選択肢がないし
RFC とかネットの標準もそれに引きずられて るし
Windows 外部コードの unicode 化はこれから本番だけど、今まで CP932, CP1252 みたいにASCII互換は大前提で来たので互換維持した方がトータルのコストは低い
結局ASCIIと互換性のないBOM付きのUTF-8だの、UTF-16だのが外部コードとして主流になる世界は来ないのだよ
887: デフォルトの名無しさん [sage] 2023/02/27(月) 18:08:52.64 ID:Y3EgytEI(3/7) AAS
>>885
885(1): デフォルトの名無しさん [] 2023/02/27(月) 17:50:44.38 ID:XtLZSXQF(1) AAS
そもそもUnicodeといえばUTF-16のことで、いまでもUTF-16のことをUnicodeと呼ぶことが多い。

Windows、JavaなどはUTF-16を先進的だと思って取り入れたから、UTF-8への対応が難しい。

UTF-8も一長一短があって、容量とマシンスペックの問題がなんとかなってきたから、UTF-8に向かっているが、この面倒くさいキャラクタセットは、1バイト文字がどのキャラクタセットなのかわからないというデメリットがある。

2バイト以上使う文字では、何のメリットもなく、言葉を表現するには明らかに退化している。
>1バイト文字がどのキャラクタセットなのかわからないというデメリットがある。
>2
2(5): デフォルトの名無しさん [sage] 2020/07/03(金) 23:13:42.20 ID:uIgOlo/V(1) AAS
「コマンドプロンプトはcp932(SJIS)である」はウソ

Windows NTの標準の文字コードであるUnicode(UTF16-LE)の
テキストファイルを作り、chcp 932のままtypeコマンドで表示してみましょう
文字化けせずに表示されますね?
(フォントがない場合は表示されないがそれ以外は問題ない)

これは明らかにコマンドプロンプトがUnicodeで動作している証拠です。

コマンドプロンプトがUnicode動いているという証明はこれで十分だと思いますが、
もし仮に反論があるならその根拠を言ってくれれば説明を追加します。
(根拠なしにcp932にきまってるだろ!みたいなものは一言で潰しますのでよろしく)
バイト以上使う文字では、何のメリットもなく、言葉を表現するには明らかに退化している。

全く意味がわからない。誰か理解できる人いる?
890
(1): デフォルトの名無しさん [sage] 2023/02/27(月) 18:39:55.97 ID:Y3EgytEI(4/7) AAS
>>888
888(1): デフォルトの名無しさん [sage] 2023/02/27(月) 18:13:02.85 ID:WKLLShCH(5/12) AAS
理解できるぞw
でも、どうせちゃんとした説明できないんでしょ。規格の用語使って技術的に正確に言える?
文字集合(chatacter set)と符号化(encoding)の違い理解してる?
901
(2): デフォルトの名無しさん [sage] 2023/02/27(月) 22:59:30.26 ID:Y3EgytEI(5/7) AAS
>>897
897(1): デフォルトの名無しさん [sage] 2023/02/27(月) 22:46:26.63 ID:WKLLShCH(7/12) AAS
>>895
Unicode signatureとしてそのような用途として使ってよいと書いてある
規格はちゃんと読もう。
・UTF-8 のBOMは必要でもなければ推奨でもない。
・それにもかかわらず、UTF-16などからの変換やsignature として、BOMに遭遇するかもしれない
の2点だよ。CP932なんて眼中にないし、「使って良い(may use)」ではなく、「遭遇するかも(may encounter)」だよ
905
(1): デフォルトの名無しさん [sage] 2023/02/27(月) 23:09:42.74 ID:Y3EgytEI(6/7) AAS
>>901
英語苦手なやつのために解説しとくと may encounter の may は「許可」ではなく、「可能性」の may だからな。
これを根拠に使って良いとはならないからな。単に過去の経緯や不出来なシステムの可能性に注意喚起してる項目。
909
(2): デフォルトの名無しさん [sage] 2023/02/27(月) 23:17:27.33 ID:Y3EgytEI(7/7) AAS
>>907
907(1): デフォルトの名無しさん [sage] 2023/02/27(月) 23:11:07.15 ID:WKLLShCH(11/12) AAS
>>905
使って良いになるだろw
可能性があるんだから
お前は、赤信号横断するやつに遭遇する可能性があるって書いてあったら、赤信号で渡って良いって考える?
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.044s