文字コード総合スレ part15 (462レス)
上下前次1-新
1: 2024/08/17(土)11:18 ID:VHa7+i59(1/2)調 AAS
文字コードについて語り合うスレです
2: 2024/08/17(土)11:23 ID:VHa7+i59(2/2)調 AAS
前スレ埋まってたので立てといた
テンプレとか過去スレを張るとNGワードで弾かれたので省略した
可能な人がいたら適当に補完しといて
3: 2024/08/17(土)11:32 ID:4RGMPEY4(1)調 AAS
しゃぶれよ
4: 2024/08/18(日)02:47 ID:NcMT6XUt(1)調 AAS
Q. UTF-8にBOMは必要ですか?
A. Unicode規格ではUTF-8にBOMを付けることは非推奨と明記されています
LinuxやMacやInternetの各規格ではUTF-8にBOMをつける文化はありません
Microsoftはかつて技術者向けにBOMを付けることを推奨しておりWindowsのツールはデフォルトでBOMを付加していましたが新しいバージョンではBOMを追加しないよう変更されていっています
現時点でも文字コードの自動判別にBOMを使用しているアプリはあるのでそいうソフトウェアの使用に限って便利なこともあります
5: 2024/08/18(日)14:23 ID:tu42Sbmi(1)調 AAS
14 2chスレ:tech
13 2chスレ:tech
12 2chスレ:tech
11 2chスレ:tech
6: 2024/08/18(日)19:18 ID:zbSOXgFa(1/2)調 AAS
ms-vcでまだs_jisを使ってる人はただちに辞める方法
ms-vcでutf-8を使う方法
https://learn.microsoft.com/ja-jp/cpp/build/reference/utf-8-set-source-and-executable-character-sets-to-utf-8?view=msvc-170
7: 2024/08/18(日)19:19 ID:zbSOXgFa(2/2)調 AAS
https://learn.microsoft.com/ja-jp/cpp/build/reference/source-charset-set-source-character-set?view=msvc-170
https://learn.microsoft.com/ja-jp/cpp/build/reference/execution-charset-set-execution-character-set?view=msvc-170
8: 2024/08/20(火)06:33 ID:LmqpP+1d(1)調 AAS
UTF8は、BOMは、非推奨の意味は、
1)UTF8はBOMは法的には🈲
2)UTF8はBOMは私的には🈲
3)UTF8はBOMは使っても🆗
4)SHIFT JISにはBOMは使おう
きっと、3)だな
だってBOMっていきなり先頭バイト
からしてUTF8に存在しないよな?
てか、UTF8は🈲にして
UTF16ビッグエディアンのみ🆗とし
ポクの大好きな笑文字☺とかは
第四水準漢字を削除して笑文字に
割当なさーーーーーい。
てか、第3水準とか第2水準の
割当た場所ってグダグダで
変更は無理ぢゃーーーん。
てか、第四水準はスッキリした
とこに割当られてるし
ドンドンサロゲートは廃止し
第四の場所に絵文字🥳とか割り当てて
超新型UTF16 旧UTF16とは、
第四水準と絵文字以外は
相互に完璧互換性在るハズ
俺って極超々天才だろぉーーぅ
9: 2024/08/20(火)13:55 ID:7gW0oenX(1)調 AAS
v=RiMT0r8f8aY
10: 2024/08/23(金)22:33 ID:MSi6WCPm(1)調 AAS
ASCII文字以外を使っているならアスキーアートではなく
シフトJISアートやユニコードアートと呼ぶべき
11: 2024/08/23(金)23:11 ID:2ix4xWvO(1)調 AAS
そんなの25年以上前の日本人に言えよ!
12: 2024/08/23(金)23:40 ID:cmdpMWs7(1)調 AAS
ターミネーターの姉はターミネーちゃん
13: 2024/08/24(土)01:25 ID:Ou5o/VfJ(1)調 AAS
終端抵抗
14: 2024/08/29(木)08:02 ID:xXLtcRNN(1)調 AAS
スレがターミネートしそうになってるやないかい!
15(1): 2024/08/30(金)16:05 ID:+R5e+PNr(1)調 AAS
もう丸囲み数字はやめようよ。
日本人はなんで打ちにくい①、②、③を書くのかな?
手間しかかからない。
16: 2024/08/30(金)16:58 ID:G4y5i48u(1)調 AAS
>>15
かわりに何を書くの?
(1)って打って①に変換するんなら手間は一緒だと思うが
単に使ってる日本語入力環境の問題じゃね?
17(1): 2024/08/30(金)17:56 ID:sr/ASeNj(1)調 AAS
数字の1を変換したら候補に①はあるから打ちにくいとは思わないな
18: 2024/08/31(土)10:12 ID:oPSFGvVw(1)調 AAS
毛頭はIIやIIIを好むけど同じ問題だな
19: 2024/08/31(土)19:43 ID:rCss6Stj(1)調 AAS
>>17
物理的なQueryキーの話じゃないぞ?
20(1): 2024/09/01(日)05:48 ID:NvwjG4ve(1/2)調 AAS
「いち」の変換の候補は、一、位置、市、イチ、一部、壱、1
、1、?、? とかいろいろ、色とりどり、どれにしような
どれを使用しような。
てゆうーーか、「まるいち」って打ち込めば、丸一 だ
ま、「まるいち」って打ち込んでも、候補に?はでるが
単に、「いち」でも?が出てくる。てゆうか、
学習機能により、「いち」と打ち込むだけで
?が2番に出るようになった。ちなみに、第1候補は、
無変換である いち のままだ。学習機能ヤバイ。スゴい。ありえない
21: 20 2024/09/01(日)05:51 ID:NvwjG4ve(2/2)調 AAS
?が?に化けちゃってる。
?は使用🈲を推奨を、推奨しようよ
22: 2024/09/01(日)10:03 ID:J4xaQJqz(1)調 AAS
25年以上前からUnicodeに含まれてる文字が化けるソフトを使用禁止にしろよ
23(1): 2024/09/01(日)13:23 ID:iI4Ho9Ek(1)調 AAS
すまん5chで文字コードバグが起きてるんだがどういう事態になってんの?
24: 2024/09/01(日)14:36 ID:MnUgJTxK(1)調 AAS
bugってるのは君の頭だ
25: 2024/09/01(日)15:05 ID:MmIh9kGJ(1)調 AAS
>>23
直ったみたいだよ
ブラウザが変換・送信した数値文字参照をぶっ壊していた模様
サンプル
2chスレ:operatex
2chスレ:poverty
26: 2024/09/01(日)21:44 ID:4u39F89u(1)調 AAS
「いち」なんて打たなくても「1」だけで良いんだけどな
27(1): 2024/09/02(月)20:00 ID:Mm7rASpk(1)調 AAS
UTF-8で見た目が同じものを二重に定義してしまった。
①~⑩までは昔からあるが、丸0と丸11以降を作り出してしまい、環境依存がさらに進んでいる。
28: 2024/09/02(月)20:47 ID:nqMgjBbq(1)調 AAS
IMEで変換する時に環境依存文字と出る文字は
CP932に無い文字ということ?
29(1): 2024/09/03(火)16:12 ID:/Ve5otW6(1)調 AAS
>?〜?までは昔からあるが、丸0と丸11以降を作り出してしまい
しかも文字コードで丸内数字の大小比較出来ないんだぜ
30: 2024/09/04(水)06:51 ID:rihkE3nT(1)調 AAS
>>29
あれ、大小比較駄目なんだっけ?
31: 2024/09/05(木)00:09 ID:/oUqYYg3(1)調 AAS
大小比較は出来るけど連続性は全く出鱈目
しかもskipしてるし場所もバラバラ
32: 2024/09/06(金)03:04 ID:MqTwQYNn(1)調 AAS
>>27
>環境依存
この場合の「環境」って何?
33: 2024/09/07(土)00:11 ID:AfmpIPHK(1)調 AAS
今って皆Unicode環境じゃん
34: 2024/09/07(土)07:34 ID:G5zNb7Sx(1)調 AAS
がフォントに全ての文字含まれているわけではない
35: 2024/09/07(土)16:32 ID:8Mdqns08(1)調 AAS
今は標準のフォントで結構文字が入ってない?
そこにNotoあたりでも足せば... No Tofuというぐらいで
36(1): 2024/09/08(日)01:58 ID:ZMDGTsRQ(1)調 AAS
市販の日本語フォントはProフォントでも Adobe-Japan1-7 にある文字どまりで2万3千文字程度
Noto も国ごと文字種ごとにファイル分割されているのでフォント切り替えないと全ての文字は表示できない(あと新しく追加された文字はない
いろいろ都合があって一つのフォントファイルに入れるのは最大でも6万字程度に抑えられてるのが実情
37(1): 2024/09/08(日)02:50 ID:sAB3C2kg(1)調 AAS
なんでたまに中国の漢字が混ざるんかね
普通に使ってても混ざった事ないけど
38: 2024/09/08(日)05:25 ID:JPjEWE8J(1)調 AAS
CJK統合漢字という黒歴史
中国が文句言ったせいで
39: 2024/09/08(日)05:27 ID:vgBqrjWA(1)調 AAS
>>36
囲み文字の話だろこれ。無理に話広げんなっちゅーの
40: 2024/09/08(日)06:41 ID:VzCs41gF(1)調 AAS
文字列"c9" と"c10" 大小比較考察に、
数値9と10は、後者は、デカい有。さて
文字列のそれは、後者はデカく無アル?
てか、wind○wsは、ファイル名並替順は
ロジックは、意味は、ワカラン有る。
てか、豆腐文字□ぽぃのとか?はやめて、👻
に、豆腐文字ぽぃのは、統一してよ。
41: 2024/09/08(日)09:04 ID:2kAAelOS(1)調 AAS
文字コードに国境がないと想像してみよう そんなに難しいことじゃない
争いや宗教がなくなり 全世界の人が平和に暮らせる
僕のことを夢想家だと言うかもしれないね
42: 2024/09/08(日)09:41 ID:KGpMdTK5(1)調 AAS
とんでとんでとんでとんで まわってまわってまわってまわる
43: 2024/09/08(日)10:09 ID:kvPGcLQN(1/2)調 AAS
日本語のソートはJISコード順じゃないと使い物にならないから内部でUnicodeからJISに変換しているという本末転倒感。
44: 2024/09/08(日)15:01 ID:AApwAY5I(1)調 AAS
何で今までと順番が違うんだとか言われても面倒だからね
文句言う連中は文字コード云々なんて知らないだろうし
45: 2024/09/08(日)16:55 ID:kvPGcLQN(2/2)調 AAS
今までと違うとか言う以前に、Unicodeのコードポイント順に整列しても意味不明だしね。
はっきり言って使い物にならない。
46(1): 2024/09/08(日)19:11 ID:We5vf4ux(1)調 AAS
Unicodeで数字とアルファベットはフォント違いや上付きや下付きの文字があって
丸囲みでもデザインの違いが何種類もあるよね
こういう装飾的な物は文字コードの方でやるのか
HTMLなどの別の規格でやるのかどっちがいいんだろうね
文字コードの方でやるとプレーンテキストでも
文を見やすくできるけど文字の検索がしづらくなるんだよね
47: 2024/09/09(月)00:03 ID:7afCe/O3(1)調 AAS
>>46
最近は記号や絵文字とかまでを登録するようなってるので普通の文字じゃなかたりするのも多数ある
一見アラビア数字に見えても実際は飾り記号(dingbat)だったり数学記号(math symbol)だったりするのも多い
(フォント違いに見えるのは数学記号)
(同じ丸数字が複数あるように見えるのは修飾数字と飾り記号)
日本からだと全角数字とかフォントによって見かけだけ違うのもあるし
48: 2024/09/09(月)18:01 ID:XsanjNXu(1)調 AAS
>>37
日本語とはっきり設定していないから
49: 2024/09/09(月)18:21 ID:zvC05GrM(1)調 AAS
そういやアップル圏のアプリの実装って
濁点半濁点付きの平仮名片仮名はちゃんと表示できてるの?
折り返し処理だとかそういう所で
50: 2024/09/10(火)13:15 ID:KGjTz1X0(1)調 AAS
アップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリ
51(2): 2024/09/11(水)22:23 ID:3H08skAT(1)調 AAS
「Unicode 16.0」が公開 〜エジプト象形文字、レガシーコンピューティング記号を大量追加
5,185の新たな文字が追加。総計で154,998文字に
https://forest.watch.impress.co.jp/docs/news/1622857.html
52(1): 2024/09/15(日)16:25 ID:FHCue4HF(1)調 AAS
Windows環境では〜記号が波ダッシュより全角チルダの方で普及しているからなのか
日本語フォントでもフォントによっては全角チルダは表示できても波ダッシュは表示できなくて
波ダッシュが指定したフォントにならないなんて事がある
53: 2024/09/15(日)17:44 ID:sX///73B(1)調 AAS
>>52
駄目フォントじゃのぉ
全角チルダをちゃんとチルダっぽくして波ダッシュと全角チルダを見た目で区別つくようにして欲しいって言ったら
全角チルダを波ダッシュ代わりにしてるWindowsユーザーからクレームが来るから面倒って言われた記憶
54(1): 2024/09/16(月)01:40 ID:oxExUg4f(1/2)調 AAS
>>51
キャラクタベースの画面でインベーダーやパックマンができるようになるのか、胸熱
55: 2024/09/16(月)01:40 ID:oxExUg4f(2/2)調 AAS
しかしこのレガシーコンピューティングの部分の多角形とかって持ってるフォントある?
https://en.wikipedia.org/wiki/Symbols_for_Legacy_Computing
以前アプリを作ってた時にこの手のマークがあるなら是非使いたかったのだが
なさそうだったので自前でアイコンを作って表示した記憶が
56: 2024/09/16(月)12:43 ID:nhODMZRh(1)調 AAS
>>54
キャラジェネなんか?
57: 2024/09/16(月)15:24 ID:KZuryTv7(1)調 AAS
無能な働き者の集まり
58(1): 2024/09/28(土)18:32 ID:1d8NABxz(1)調 AAS
>>51
Game spritesやIconsのリファレンス元が知りたい
Symbols for Legacy Computing Supplement
https://www.unicode.org/charts/PDF/Unicode-16.0/U160-1CC00.pdf
59: 2024/09/30(月)10:07 ID:4t7Lwjtc(1)調 AAS
>>58
インベーダーっぽいのは「ALIEN CRAB」(異星カニ)、パックマンっぽいのは
「SNAKE」(ヘビ)等、固有名を避けあくまでも一般的なものとして逃げようとする
姿勢が見える
60: 2024/10/02(水)19:07 ID:C0WilfCa(1)調 AAS
ソリッドスネーク
61: 2024/10/05(土)09:08 ID:WFnL/JH1(1)調 AAS
ソリッドステートサバイバー + スネークマンショー
62: 2024/10/06(日)11:23 ID:BDyILJJL(1)調 AAS
なんつーか、PCGだなあ。
今更だけど。
63: 2024/10/06(日)17:40 ID:ALnpv1f2(1)調 AAS
横1列のドットパターンでコード割り当てて
合成も拡張して縦に並べられるとええかも
64: 2024/10/10(木)12:19 ID:bwO1aVtU(1)調 AAS
YMOと描いてイモと読む
65: 2024/10/13(日)00:25 ID:VNPRmq36(1)調 AAS
YMO欽トリオ... テクノな曲あったよな
66(1): 2024/11/08(金)16:40 ID:M93pzeOZ(1)調 AAS
「U+〜」の表記法って正式な名称ないの?「Short Identifier」?
67: 2024/11/08(金)17:06 ID:TFeZf1kn(1)調 AAS
https://www.unicode.org/versions/Unicode16.0.0/core-spec/appendix-a/#G12668
ないんでコードポイント表記とか
68(1): 2024/11/08(金)18:20 ID:y8v+DuF6(1)調 AAS
>>66
そもそもUTF-8はその表記が正式な表記だから、表記の名称が存在しない。
69: 2024/11/09(土)19:37 ID:otPYdJdQ(1)調 AAS
天皇に名字がないようのなものか? って違うか
70(2): 2024/11/09(土)20:43 ID:UMsfYHki(1)調 AAS
回答ありがとう。表記法や表現自体には特には名前ないんか。
正規表現のグループに名前を付けようとして
「(?<UnicodeCodePoint>(?<Prefix>U\+)(?<Hex>[0-9A-F]{4,6}))」
みたいにしたんだけど、
「U+HHHH」全体をコードポイントって呼んでいいのか、
「HHHH」部分だけがコードポイントと呼べるものなのか、
っていう疑問が湧いたんだよね。
調べたらすぐ分かるかと思ったら全然分からなくてモヤモヤしてた。
71: 2024/11/09(土)23:09 ID:OjNPz0/0(1)調 AAS
>>70
xxxx がコードポイント(code point)
U+xxxx がコードポイント表記 (code point notation)
とかで良いんじゃね
知らんけど
72: 2024/11/09(土)23:59 ID:aDTWwhb+(1)調 AAS
0xBEEFとBEEFは表現は違うけどどちらも16進表記で指してる値は同じ
10進表記の48879も同じ値を指す
Unicodeのコードポイントってのは値を指してる
だからなんやねんだけど
73(3): 2024/11/10(日)02:50 ID:NcxfIIMm(1)調 AAS
>>70
「U+」の部分はUTF-8だという意味
74: 2024/11/10(日)03:16 ID:c/95e8WD(1/2)調 AAS
>>73
コードポイントとエンコードの区別が付かない男の人って
75: 2024/11/10(日)12:29 ID:AfmJKCJ3(1)調 AAS
>>68 ≒ >>73
これはひどい
76: 2024/11/10(日)16:10 ID:DLtuPbgG(1/2)調 AAS
Cスレの通りにやって文字出力したら化けるんだけど、文字コード民的な正しい対処法は?
ちゃんとソースファイルがUTF-8なのは確認した
2chスレ:tech
#include <windows.h>
int main(void)
{
LPTSTR lptStr = TEXT("テスト😊");
printf("%s\n", lptStr);
}
77: 2024/11/10(日)16:20 ID:DLtuPbgG(2/2)調 AAS
win32でのAやW、charとwchar_tの事は分かっていて
Linux他でのクロスコンパイルを考えてwchar_tは使わずにUTF-8 everywhereで通しつつ
puts("テスト😊");
が文字化けしない様にしたい
特定システムロケールは仮定せず
ターミナルではchcp 65001してある
場合です
78(1): 2024/11/10(日)16:47 ID:ZReNrF9P(1)調 AAS
端末がUTF-8非対応なのはないとして
出力をファイルへリダイレクトするかダンプして
想定どおりのバイト列か確認してみては?
79(1): 2024/11/10(日)16:48 ID:IKmeMWRS(1/2)調 AAS
C詳しくないんで、正しい対処法は知らんけど、どこの通りで手元で出力できた。
https://www.reddit.com/r/C_Programming/comments/1adv86p/how_do_i_print_a_penguin_emoji_in_c_language/?rdt=48269
80(1): 2024/11/10(日)16:48 ID:qC3Ky4ZL(1)調 AAS
分かってるならなんでLPTSTRから変換せずに使ってんの
81(1): 2024/11/10(日)16:51 ID:IKmeMWRS(2/2)調 AAS
具体的な回答のリンクにできてなかったんで張り直し
これの前半のほうやね
https://www.reddit.com/r/C_Programming/comments/1adv86p/comment/kk5vdm1/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button
82: 2024/11/10(日)17:29 ID:x8h1RQEe(1/4)調 AAS
>>78-81
ありがとうございます
putsで文字化けしていたのは、コマンドラインでソースutf-8指定したら文字化けは直りました
だけど、引数が受け取れないですね
#include <stdio.h>
int main(int argc, char **argv) {
puts("テスト0😊");
for (int i = 1; i < argc; i++)
puts(argv[i]);
}
$ cl -utf-8 ConsoleApplication1.c
$ ./ConsoleApplication1.exe テスト1😊 テスト2😊
テスト0😊
???1??
???2??
$ ./ConsoleApplication1.exe テスト1😊 テスト2😊 > out.txt
$ cat out.txt
テスト0😊
???1??
???2??
(システムロケールEnglishでの環境です)
83: 2024/11/10(日)17:34 ID:x8h1RQEe(2/4)調 AAS
デバッグで確認したところ、引数のテスト1😊 テスト2😊は受け取りの時点(argv[i])でアルファベット以外の各コードポイントが?になってます
84: 2024/11/10(日)17:39 ID:x8h1RQEe(3/4)調 AAS
WindowsTerminal
MSYSTEM=UCRT64のMSYS2 bashです
$ echo テスト1😊 テスト2😊
テスト1😊 テスト2😊
85: 2024/11/10(日)17:45 ID:x8h1RQEe(4/4)調 AAS
$ gcc ConsoleApplication1.c
$ ./a.exe
テスト0😊
$ ./a.exe テスト1😊 テスト2😊
Error: Command line contains characters that are not supported
in the active code page (1252).
UTF8 everywhereは厳しいですかね?
86: 2024/11/10(日)19:10 ID:c/95e8WD(2/2)調 AAS
WindowsでワイドキャラクタってのはUTF16LEのことだよ?
87(1): 2024/11/10(日)20:20 ID:+vLaBA7E(1)調 AAS
UTF-8 everywhere行けました
$ cat utf8.rc
#include "winuser.h"
CREATEPROCESS_MANIFEST_RESOURCE_ID RT_MANIFEST "utf8.manifest"
$ cat utf8.manifest
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<assembly xmlns="urn:schemas-microsoft-com:asm.v1" manifestVersion="1.0" xmlns:asmv3="urn:schemas-microsoft-com:asm.v3">
<asmv3:application>
<asmv3:windowsSettings xmlns="http://schemas.microsoft.com/SMI/2019/WindowsSettings">
<activeCodePage>UTF-8</activeCodePage>
</asmv3:windowsSettings>
</asmv3:application>
</assembly>
$ cl -utf-8 ConsoleApplication1.c
$ mt.exe -nologo -manifest "utf8.manifest" -outputresource:"ConsoleApplication1.exe;#1"
$ ./ConsoleApplication1.exe テスト1😊 テスト2😊
テスト0😊
テスト1😊
テスト2😊
$ windres --input utf8.rc --output utf8.res --output-format=coff
$ gcc ConsoleApplication1.c utf8.res
$ ./a.exe テスト1😊 テスト2😊
テスト0😊
テスト1😊
テスト2😊
88: 2024/11/10(日)22:05 ID:ictCxOlF(1)調 AAS
>>87
下記の手続きを適用したってことなのかな?
Windows アプリで UTF-8 コード ページを使用する - Windows apps | Microsoft Learn
https://learn.microsoft.com/ja-jp/windows/apps/design/globalizing/use-utf8-code-page
89: 2024/11/11(月)06:32 ID:bzvUbbzk(1)調 AAS
はい、検索して適当に拾ってきたのでxmlnsが微妙に違いますが同じことですね
MinGW64ツールチェーンではutf8.rcを経由してマニフェスト埋め込みしてますが
MSVCツールチェーンではその経路だとこうなります
$ rc utf8.rc
$ cl -utf-8 ConsoleApplication1.c utf8.res
ついでにPythonでもやってみました
$ cat ConsoleApplication1.py
import sys
print("テスト0😊")
for s in sys.argv[1:]:
print(s)
$ python313.exe ConsoleApplication1.py テスト1😊 テスト2😊
テスト0😊
テスト1😊
テスト2😊
環境変数がセットされてたので強制的に空にしても問題ないようです
$ PYTHONIOENCODING= PYTHONUTF8= python313.exe ConsoleApplication1.py テスト1😊 テスト2😊
テスト0😊
テスト1😊
テスト2😊
90(1): 2024/11/11(月)11:04 ID:RXw/cl7Z(1)調 AAS
スレ汚しでしかない
91: 2024/11/11(月)13:27 ID:ZQtGCGPy(1)調 AAS
>>90
まあ、あの荒れそうな言語がユニコード引数でエラー出すからな
92(1): 2024/11/15(金)23:15 ID:5CeogfbD(1)調 AAS
>>73
コードはユニコード
それをどうエンコーディングするかでUTF8やUTF16やUTF32などがある
ネットの標準がUTF8に統一されてなって
ファイルシステムでもUTF8に統一されつつあり
プログラム内部でもほとんどの用途はそのまま透過的にUTF8が有利に
固定長で扱うUTF32はムダすぎで
可変長のUTF8は後ろからでも切れ目を間違えことなく
表示幅問題はUTF8/UTF32関係なく発生するため
93(1): 2024/11/17(日)17:51 ID:4RtrNUdf(1)調 AAS
>>92
>ファイルシステムでもUTF8に統一されつつあり
例を挙げてもらえますか?
94(2): 2024/11/17(日)18:35 ID:hkK5KPG+(1)調 AAS
>>93
Linux distro, MacOS, android, iOS,...
挙げ始めたが最近のリリースだと Windows 以外のメジャーどころは全部じゃね?
95: 2024/11/18(月)23:18 ID:cZsx9Sbk(1/2)調 AAS
UTF-8は世界の誰もが好むわけではない。
どの民族もUTF-8の良いところと悪いところで悩んでいる
96: 2024/11/18(月)23:20 ID:cZsx9Sbk(2/2)調 AAS
>>94
勘違いしているけど、それらの製品でも区別して使う分けている。
97(1): 2024/11/20(水)15:38 ID:84IcR/Q0(1)調 AAS
>>94
Linux (ext4) は、ファイルシステムとしてはエンコーディングは規定されてないのでは?
ディストロやユーザーがUTF-8を使ったりするのは自由だが
よってAndroidも同様
なんだAppleだけじゃんw
98(1): 2024/11/20(水)16:37 ID:APWVo8Zw(1)調 AAS
>>97
そんなこと言いだしたら APFS も NTFS も単にバイト列を記録してるのに過ぎない。
それをOSやライブラリとしてどう解釈するかがファイルシステムの文字列。
だから linux kernel でなくて linux distro の問題。
(もっとも最近の Linux kernel はデフォルトで UTF-8 を指定するABIとかあって文字コードの変換したりするけど。別問題)
99(1): 2024/11/21(木)12:47 ID:SUxxkxcm(1)調 AAS
UTF-8も完璧じゃないからな
100: 2024/11/21(木)14:20 ID:GU8mH0bt(1)調 AAS
>>99
キミの言う「完璧」とは一体...
上下前次1-新書関写板覧索設栞歴
あと 362 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.047s