[過去ログ] 文字コード総合スレ Part11 (1002レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
741: デフォルトの名無しさん [sage] 2018/08/18(土) 12:33:47 ID:KC80I9ck(1/4) AAS
unicode の議論と wchar_t の議論を混ぜるやつは素人。
unicode が普及するすっと前から wchar_t は普通に使われてる。
745: デフォルトの名無しさん [sage] 2018/08/18(土) 14:33:57 ID:KC80I9ck(2/4) AAS
>>744コンパイラとか libc を設計する奴以外は内部実装関係ないやろ。内部実装に依存したら移植性が無くなる。
知りたかったらlibcのソース嫁。最近の linux の glibc ならUCS4に統一。昔のunixだと EUCコードそのまま16ビットでフラグ付きで入れてた。
748: デフォルトの名無しさん [sage] 2018/08/18(土) 14:55:58 ID:KC80I9ck(3/4) AAS
>>746746(1): デフォルトの名無しさん [sage] 2018/08/18(土) 14:42:51 ID:5gN61dbI(3/3) AAS
> 昔のunixだと EUCコードそのまま16ビットでフラグ付きで入れてた。
それはwchar_tが32bitってことかな?
16bitでは不可能だよね?
知らないなら、変な知ったかぶりせずに黙ってるべき。
実装によって色々差があるけど最上位ビットとかをフラグに使用して16ビットに詰め込んでたんだよ。
うろ覚えだけど、例えば
0021-007e に ascii
00a1-00fe に jis kana
2121-7e7e に 0208
a1a1-fefe に 0212
とか、そんな感じ。
750: デフォルトの名無しさん [sage] 2018/08/18(土) 15:32:18 ID:KC80I9ck(4/4) AAS
>>747747(1): デフォルトの名無しさん [sage] 2018/08/18(土) 14:48:48 ID:/4eOy7p1(1) AAS
wchar_t自体はcharset/encoding独立だとしても、実際にEUC-JPを格納する実装が
存在していたとは知らなかったな。
16ビットでなくて 32ビットで良いなら、今でも FreeBSD は EUC-JP をそのまま wchar_t に入れてる。
32bit なのでフラグ操作とかもなくて生のまま 0x008fa2be とか 0x00008ea0 とか。
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.046s