[過去ログ] 文字コード総合スレ part14 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
12
(2): 2023/03/05(日)10:24:42.19 ID:Dqp2Pk7H(1) AAS
The Unicode® Standard Version 15.0 – Core Specification
外部リンク[pdf]:www.unicode.org

When converting between different encoding schemes, extreme care must be taken in handling any initial byte order marks.
For example, if one converted a UTF-16 byte serialization with an initial byte order mark to a UTF-8 byte serialization, thereby converting the byte order mark to <EF BB BF> in the UTF-8 form, the <EF BB BF> would now be ambiguous as to its status as a byte order mark (from its source) or as an initial zero width no break space.
If the UTF-8 byte serialization were then converted to UTF-16BE and the initial <EF BB BF> were converted to <FE FF the interpretation of the U+FEFF character would have been modified by the conversion.
This would be nonconformant behavior according to conformance clause C7, because the change between byte serializations would have resulted in modification of the interpretation of the text.
This is one reason why the use of the initial byte sequence <EF BB BF> as a signature on UTF-8 byte sequences is not recommended by the Unicode Standard.
24: 2023/03/05(日)21:56:43.19 ID:dEWQ/p/B(3/5) AAS
元がASCII → UTF-8 (BOM なし)に変換? → それはただのASCII

UTF-8に対応するのであれば
128~255を許容した上で
UTF-8の仕様に対応しなければいけない

UTF-8に対応するならBOMにも対応しなければいけない
それだけのこと
67
(1): 2023/03/07(火)12:02:26.19 ID:CdvGJ9oA(1) AAS
将来SJIS(cp932)やそれ以外のcp(cp65001を除く)は全部無くなるんだろうし
その頃にはUTF-8にBOM付けるやつは居なくなると想定していて
その準備段階として現状UTF-8にBOM付けるべきでないってスタンス
今がんばってBOM付けろって言ってるアホは死ぬまでSJIS浸かってろ
301
(1): 2023/05/29(月)13:52:34.19 ID:M19znpYQ(1) AAS
MSはJIS X 0213:2012のIVSに
Wordが早く対応したりしてそれほど悪い印象はない
しかしパス名が未だにCP932系なのは何とかならんのか
433: 2023/10/08(日)05:46:34.19 ID:c7bH/Jal(3/3) AAS
いいかげんチマチマと8bitづつ扱うようなケチな精神がいけない。
8bit CPU の事などもう忘れろ。
475: 2023/10/16(月)11:23:36.19 ID:WBw8/fQB(2/2) AAS
>>473
マイクロソフトは昔はプログラマ向けにBOMつけることを推奨してたんだよ。ツールとかも勝手にBOMを追加していた。
そもそもユニコード規格で UTF8 のBOMが文字コード判別用として規定されたのもマイクロソフトの主張によるもの。
他の企業とかは反対だったけどMSが強く主張するので、妥協として非推奨という形で規格に取り入れられた。
482: 2023/10/20(金)05:05:07.19 ID:oeTulwfB(3/4) AAS
>>481
なるほど
試しにソースをUTF-8に変換してみたら問題ないっぽいので、そこに書かれているような
UCSのコードポイントがないだとか拡張されたフォントが必要だとかそういうのも
昔話くさいですね。関係者の皆様(?)ご苦労様でした
537: 2024/02/08(木)18:57:22.19 ID:T36ggrXR(1) AAS
>>536
珍しい名字はずっと排除していたのがMS-IME

Google日本語入力が登場してから焦って対応したが、体制が貧弱だったせいでもはや追いつけない。
609: 2024/03/31(日)01:53:54.19 ID:x9YjQ3QN(1) AAS
処理系というかDOS/WindowsならOSがそうなってる
840
(1): 2024/06/17(月)23:07:05.19 ID:4L+665Jw(1) AAS
>>834
それさ、同じ漢字と、字体違いの漢字を同一だと思っているでしょ?

同じ意味の漢字と、見た目違いの同じ意味の漢字は別物だよ
859: 2024/06/27(木)14:19:43.19 ID:R4TfblGO(1) AAS
>>857
データベースないのかな?
0221以外のJISにない文字も含めた奴
908: 2024/07/18(木)19:15:32.19 ID:GUg+Zpj4(3/3) AAS
アスキー文字だけなら、UTF-8の方がいいという判断になった
最低でも16ビットを使って1文字を表現するものが受け入れられないのは、そのひとの使う言語による
928: 2024/07/20(土)17:40:52.19 ID:pd3T6vIK(2/12) AAS
>>920
それはWindowsの特徴ではない

自然言語をそのまま使えないかという発想の歴史は古い

エスケープシーケンスの実装というまた別の問題を引き起こしているが
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.038s