[過去ログ] 文字コード総合スレ part13 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
61: デフォルトの名無しさん [sage] 2021/05/25(火) 08:37:04.98 ID:6TyV4LYI(1) AAS
>>5757(2): デフォルトの名無しさん [sage] 2021/05/24(月) 19:37:25.20 ID:RWCB+vU8(1) AAS
文字コードの勉強中です
Windowsで使われている文字コードはCP932(Shift-JISの拡張版)ということまで分かりました。 IMEパッドで理解を深めようとしているのですが、分からないことがあるのでご教示お願いします。
・IMEパッドの「シフトJIS」はCP932のことを指していると思っていいですか?
・IMEパッドの「JIS X 0208」はCP932の文字集合だと思っていいですか?
・だとすると「JIS X 0208」と「シフトJIS」は一対一で対応すると思いますが、「シフトJIS」にあって「JIS X 0208」に無い文字(?や?など)があるのはなぜですか?
過疎っているようですがご回答いただけると幸いです
すごく大まかな説明をすると、
Windowsで使われているShiftJISの文字コードはMicroSoft版方言に侵されてて純正のShiftJISではない
「CP932」という言い方では純正ShiftJISなのかそれともMicroSoft版・Mac版・IBM版その他の方言なのか分からない
(まあ一般にはCP932という言い方をするとMS版のことを指す
明示的にMS版のCP932だということを示す際には、MS932とかWindows31Jとかいう呼び方をする)
なので
1つ目は、その「CP932」が指すものによる、純正ShiftJISを想定しているなら厳密には違う
2つ目は・・・・これもごくごく大まかに言ってしまうと「JIS X 0208」はシフトさせてないおおもとのJIS漢字コードのこと
(なのでShiftJISとはコード体系が違う。計算でシフトさせることで簡単にJIS⇔ShiftJISが導出できるけど)
3つ目のは、違ってる箇所の具体例がまさに丸数字とかの特殊文字に該当してる
というかこれは歴史的経緯によるものだからなあ、後世からみたら理不尽の塊でしかないだろう
理由を考えてみろと言われて分かるわけがないよ
208: デフォルトの名無しさん [sage] 2021/09/24(金) 09:53:35.98 ID:IHKg493W(1) AAS
前半について言えば、日本語環境以外では中文フォントが優先利用されるようになっているからだろう。
212: デフォルトの名無しさん [sage] 2021/10/01(金) 01:14:25.98 ID:C9iYF2oS(1) AAS
もはや「安」と「あ」を同じ文字だって言ってるレベルだもんな
506: デフォルトの名無しさん [sage] 2022/07/16(土) 02:06:52.98 ID:V+kaf7mC(2/3) AAS
>>505最強ロボ ダイオージャを知らない人にもわかるように書きなよ
507(1): デフォルトの名無しさん [sage] 2022/07/16(土) 04:22:29.98 ID:6TWzUKaQ(1) AAS
その界隈の人はクスリとくるジョークなのだろうけど理解できないのがもどかしいな
591(1): デフォルトの名無しさん [sage] 2022/08/20(土) 12:56:39.98 ID:2oOKxcfG(1) AAS
>>589いや、古代文字の解析はちょっとづつでも進んでるよ。それで埋まったりしないだろうけど。
あとユニコードには意味不明のまま形だけで登録されている古代文字もあるので、解析されてなくても良いという。
620(1): デフォルトの名無しさん [sage] 2022/09/18(日) 00:02:30.98 ID:fKsdepJz(1/3) AAS
>>619環境によって逆向きにされるかもしれないのはだめじゃない?
逆だと意味がひっくり返るんだから
700(1): デフォルトの名無しさん [sage] 2023/02/12(日) 12:22:59.98 ID:2oU17ty6(1) AAS
Linux は内部的には、UTF32 も使っているけど、外には出ない。
外部とはUTF8 で統一されている
Windows のCP 何々みたいなものは地獄。
他国語のCPを誰も知らない
例えば日本人だと、CP932 しか知らない。
逆に外人は、誰もCP932を知らない
つまり、外人同士が意思疎通できないシステム
ただし、Linuxでも、iconv を使うけど、
Ruby では非推奨になって、NKF を使う
今では、CP932とか日本語を扱えるのは、Rubyだけだろ。
外人は誰も、CP932など知らない
704: デフォルトの名無しさん [sage] 2023/02/14(火) 08:08:42.98 ID:XLVypbdR(1/2) AAS
当時ISO2022 という規格があったのに
CP932 などというふざけた規格を作ったのが悪い
772(2): デフォルトの名無しさん [sage] 2023/02/23(木) 22:30:34.98 ID:sj7+9G1y(4/4) AAS
そもそもネットの通信でも、MacでもLinuxでもUTF-8にBOMつけたりしない。
UTF-8にBOMつけたのは過去のWindowsだけって時点でゴミなのわかるだろ。そのWindowsだってデフォルトでは付けない方向に舵を切った。
今時BOM必要って言ってるのは時代の変化についてこれなくて、過去の環境に生き続けたいロートルだけ。
777(1): デフォルトの名無しさん [sage] 2023/02/24(金) 00:16:53.98 ID:/JDec9CR(1/14) AAS
>>700
Windowsは内部的にはUTF16で統一されてるよ
そこはLinuxよりも優れた設計
830: デフォルトの名無しさん [sage] 2023/02/25(土) 08:48:27.98 ID:dveJDxzx(4/8) AAS
現実的っていうのはEUC-JPで書かれた
ウェブサイトが見れなくなるってこと?
832(2): デフォルトの名無しさん [sage] 2023/02/25(土) 10:44:41.98 ID:IGzyIaR2(2/3) AAS
今後はファイルや外部通信はUTF-8がデフォルトになる
デフォルトの意味が理解できないド素人がいるみたいなので書いておくと
「アプリは特に文字コードの指定が無かった場合はUTF-8で出力するべき、指定が無かった場合はUTF-8として読み込むべきである」ということ
つまりBOMが無くてもUTF-8とみなすべきなので、UTF-8にBOMは不要
970: デフォルトの名無しさん [sage] 2023/03/02(木) 13:36:59.98 ID:QpnfRCZF(1) AAS
BOMを付けておくと都合がいいケースがたまたまあっただけ
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 1.384s*