C言語なら俺に聞け 163 (987レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
893(1): デフォルトの名無しさん (ワッチョイ ff02-Q0Sn) [] 2025/07/06(日) 09:24:52.33 ID:jyZjYPic0(1/2) AAS
>>861861(1): デフォルトの名無しさん (ワッチョイ 5f98-4xcB) [sage] 2025/07/01(火) 06:18:52.12 ID:M5z4vIa80(2/10) AAS
と思ったが、もしかして最近の言語はutf-8をネイティブサポートしていて、(=内部文字列がutf-8)
この辺を全部自動的に回避出来るのか?(=プログラマに文字コードの知識が全く必要ない)
Cはutf以前だから勿論サポート無し
PHPはWeb言語だから文字列=バイトストリーム扱いで、共用体が駆使されるネット向けになってるだけ
JSはutf-16だったがサロゲートペア導入でAPIが2つある(サロゲートペア対応版と非対応版)
Rustは知らんが、さらっと調べた限りutf-8で、逆にインデックスアクセスが出来ないらしい(3文字目を[3]で取得出来ない)
ただこれだと遅くなるだけなので、Cを駆逐したいと言いながら便利さを追求してるRustは迷走してる
Pythonは、どうやら全自動で出来るみたいね…
python(リファレンス実装、すなわちcpython)の文字列内部表現は全部UTF-32だよ
やはり(概ね)固定長がプログラムで処理しやすい
外部的にはutf-8を吐くけど
900(1): デフォルトの名無しさん (ワッチョイ ff02-Q0Sn) [] 2025/07/06(日) 19:24:09.13 ID:jyZjYPic0(2/2) AAS
>>898898(1): デフォルトの名無しさん (ワッチョイ 9757-1drH) [sage] 2025/07/06(日) 14:21:04.82 ID:Zx51jGf/0(1/2) AAS
>>893
おお、utf-32の実装例が有ったか
しかしcpython(1991)に対しサロゲートペア導入(1996)なので、
utf-16ではなくutf-32にしたのは謎だな
先見の明があったのか、(その頃既にunicodeが枯渇気味なのを知っていたとか?)
或いはサロゲートペア対応時にutf-16→utf-32に書き換えたのか?
2.7までは文字列とユニコード文字列があった
確かu"unicode"的な記法で(おぼろげ)
3にメジャーアップデートして文字列はユニコのみになった
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.034s