文字コード総合スレ part15 (462レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
1: デフォルトの名無しさん [] 2024/08/17(土) 11:18:00.01 ID:VHa7+i59 文字コードについて語り合うスレです http://mevius.5ch.net/test/read.cgi/tech/1723861080/1
2: デフォルトの名無しさん [sage] 2024/08/17(土) 11:23:28.13 ID:VHa7+i59 前スレ埋まってたので立てといた テンプレとか過去スレを張るとNGワードで弾かれたので省略した 可能な人がいたら適当に補完しといて http://mevius.5ch.net/test/read.cgi/tech/1723861080/2
3: デフォルトの名無しさん [sage] 2024/08/17(土) 11:32:03.55 ID:4RGMPEY4 しゃぶれよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/3
4: デフォルトの名無しさん [sage] 2024/08/18(日) 02:47:53.12 ID:NcMT6XUt Q. UTF-8にBOMは必要ですか? A. Unicode規格ではUTF-8にBOMを付けることは非推奨と明記されています LinuxやMacやInternetの各規格ではUTF-8にBOMをつける文化はありません Microsoftはかつて技術者向けにBOMを付けることを推奨しておりWindowsのツールはデフォルトでBOMを付加していましたが新しいバージョンではBOMを追加しないよう変更されていっています 現時点でも文字コードの自動判別にBOMを使用しているアプリはあるのでそいうソフトウェアの使用に限って便利なこ
ともあります http://mevius.5ch.net/test/read.cgi/tech/1723861080/4
5: デフォルトの名無しさん [] 2024/08/18(日) 14:23:47.18 ID:tu42Sbmi 14 https://mevius.5ch.net/test/read.cgi/tech/1677826018/ 13 https://mevius.5ch.net/test/read.cgi/tech/1593777227/ 12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/ 11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/ http://mevius.5ch.net/test/read.cgi/tech/1723861080/5
6: デフォルトの名無しさん [] 2024/08/18(日) 19:18:59.30 ID:zbSOXgFa ms-vcでまだs_jisを使ってる人はただちに辞める方法 ms-vcでutf-8を使う方法 https://learn.microsoft.com/ja-jp/cpp/build/reference/utf-8-set-source-and-executable-character-sets-to-utf-8?view=msvc-170 http://mevius.5ch.net/test/read.cgi/tech/1723861080/6
7: デフォルトの名無しさん [] 2024/08/18(日) 19:19:42.01 ID:zbSOXgFa https://learn.microsoft.com/ja-jp/cpp/build/reference/source-charset-set-source-character-set?view=msvc-170 https://learn.microsoft.com/ja-jp/cpp/build/reference/execution-charset-set-execution-character-set?view=msvc-170 http://mevius.5ch.net/test/read.cgi/tech/1723861080/7
8: デフォルトの名無しさん [] 2024/08/20(火) 06:33:10.98 ID:LmqpP+1d UTF8は、BOMは、非推奨の意味は、 1)UTF8はBOMは法的には🈲 2)UTF8はBOMは私的には🈲 3)UTF8はBOMは使っても🆗 4)SHIFT JISにはBOMは使おう きっと、3)だな だってBOMっていきなり先頭バイト からしてUTF8に存在しないよな? てか、UTF8は🈲にして UTF16ビッグエディアンのみ🆗とし ポクの大好きな笑文字☺とかは 第四水準漢字を削除して笑文字に 割当なさーーーーーい。 てか、第3水準とか第2水準の 割当た場所ってグダグダで
変更は無理ぢゃーーーん。 てか、第四水準はスッキリした とこに割当られてるし ドンドンサロゲートは廃止し 第四の場所に絵文字🥳とか割り当てて 超新型UTF16 旧UTF16とは、 第四水準と絵文字以外は 相互に完璧互換性在るハズ 俺って極超々天才だろぉーーぅ http://mevius.5ch.net/test/read.cgi/tech/1723861080/8
9: デフォルトの名無しさん [] 2024/08/20(火) 13:55:10.92 ID:7gW0oenX v=RiMT0r8f8aY http://mevius.5ch.net/test/read.cgi/tech/1723861080/9
10: デフォルトの名無しさん [sage] 2024/08/23(金) 22:33:12.33 ID:MSi6WCPm ASCII文字以外を使っているならアスキーアートではなく シフトJISアートやユニコードアートと呼ぶべき http://mevius.5ch.net/test/read.cgi/tech/1723861080/10
11: デフォルトの名無しさん [] 2024/08/23(金) 23:11:16.91 ID:2ix4xWvO そんなの25年以上前の日本人に言えよ! http://mevius.5ch.net/test/read.cgi/tech/1723861080/11
12: デフォルトの名無しさん [sage] 2024/08/23(金) 23:40:41.57 ID:cmdpMWs7 ターミネーターの姉はターミネーちゃん http://mevius.5ch.net/test/read.cgi/tech/1723861080/12
13: デフォルトの名無しさん [] 2024/08/24(土) 01:25:39.89 ID:Ou5o/VfJ 終端抵抗 http://mevius.5ch.net/test/read.cgi/tech/1723861080/13
14: デフォルトの名無しさん [sage] 2024/08/29(木) 08:02:28.17 ID:xXLtcRNN スレがターミネートしそうになってるやないかい! http://mevius.5ch.net/test/read.cgi/tech/1723861080/14
15: デフォルトの名無しさん [] 2024/08/30(金) 16:05:00.99 ID:+R5e+PNr もう丸囲み数字はやめようよ。 日本人はなんで打ちにくい①、②、③を書くのかな? 手間しかかからない。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/15
16: デフォルトの名無しさん [sage] 2024/08/30(金) 16:58:48.30 ID:G4y5i48u >>15 かわりに何を書くの? (1)って打って①に変換するんなら手間は一緒だと思うが 単に使ってる日本語入力環境の問題じゃね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/16
17: デフォルトの名無しさん [sage] 2024/08/30(金) 17:56:41.94 ID:sr/ASeNj 数字の1を変換したら候補に①はあるから打ちにくいとは思わないな http://mevius.5ch.net/test/read.cgi/tech/1723861080/17
18: デフォルトの名無しさん [] 2024/08/31(土) 10:12:54.19 ID:oPSFGvVw 毛頭はIIやIIIを好むけど同じ問題だな http://mevius.5ch.net/test/read.cgi/tech/1723861080/18
19: デフォルトの名無しさん [] 2024/08/31(土) 19:43:43.53 ID:rCss6Stj >>17 物理的なQueryキーの話じゃないぞ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/19
20: デフォルトの名無しさん [] 2024/09/01(日) 05:48:48.48 ID:NvwjG4ve 「いち」の変換の候補は、一、位置、市、イチ、一部、壱、1 、1、?、? とかいろいろ、色とりどり、どれにしような どれを使用しような。 てゆうーーか、「まるいち」って打ち込めば、丸一 だ ま、「まるいち」って打ち込んでも、候補に?はでるが 単に、「いち」でも?が出てくる。てゆうか、 学習機能により、「いち」と打ち込むだけで ?が2番に出るようになった。ちなみに、第1候補は、 無変換である いち のままだ。学習機能ヤバイ。スゴい。ありえない http://mevius
.5ch.net/test/read.cgi/tech/1723861080/20
21: 20 [] 2024/09/01(日) 05:51:10.12 ID:NvwjG4ve ?が?に化けちゃってる。 ?は使用🈲を推奨を、推奨しようよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/21
22: デフォルトの名無しさん [sage] 2024/09/01(日) 10:03:06.38 ID:J4xaQJqz 25年以上前からUnicodeに含まれてる文字が化けるソフトを使用禁止にしろよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/22
23: デフォルトの名無しさん [sage] 2024/09/01(日) 13:23:41.75 ID:iI4Ho9Ek すまん5chで文字コードバグが起きてるんだがどういう事態になってんの? http://mevius.5ch.net/test/read.cgi/tech/1723861080/23
24: デフォルトの名無しさん [sage] 2024/09/01(日) 14:36:43.89 ID:MnUgJTxK bugってるのは君の頭だ http://mevius.5ch.net/test/read.cgi/tech/1723861080/24
25: デフォルトの名無しさん [sage] 2024/09/01(日) 15:05:05.84 ID:MmIh9kGJ >>23 直ったみたいだよ ブラウザが変換・送信した数値文字参照をぶっ壊していた模様 サンプル https://kes.5ch.net/test/read.cgi/operatex/1724088826/94-103n https://greta.5ch.net/test/read.cgi/poverty/1725160810/ http://mevius.5ch.net/test/read.cgi/tech/1723861080/25
26: デフォルトの名無しさん [sage] 2024/09/01(日) 21:44:20.22 ID:4u39F89u 「いち」なんて打たなくても「1」だけで良いんだけどな http://mevius.5ch.net/test/read.cgi/tech/1723861080/26
27: デフォルトの名無しさん [] 2024/09/02(月) 20:00:21.60 ID:Mm7rASpk UTF-8で見た目が同じものを二重に定義してしまった。 ①~⑩までは昔からあるが、丸0と丸11以降を作り出してしまい、環境依存がさらに進んでいる。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/27
28: デフォルトの名無しさん [] 2024/09/02(月) 20:47:47.09 ID:nqMgjBbq IMEで変換する時に環境依存文字と出る文字は CP932に無い文字ということ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/28
29: デフォルトの名無しさん [] 2024/09/03(火) 16:12:49.13 ID:/Ve5otW6 >?〜?までは昔からあるが、丸0と丸11以降を作り出してしまい しかも文字コードで丸内数字の大小比較出来ないんだぜ http://mevius.5ch.net/test/read.cgi/tech/1723861080/29
30: デフォルトの名無しさん [sage] 2024/09/04(水) 06:51:59.10 ID:rihkE3nT >>29 あれ、大小比較駄目なんだっけ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/30
31: デフォルトの名無しさん [] 2024/09/05(木) 00:09:14.51 ID:/oUqYYg3 大小比較は出来るけど連続性は全く出鱈目 しかもskipしてるし場所もバラバラ http://mevius.5ch.net/test/read.cgi/tech/1723861080/31
32: デフォルトの名無しさん [sage] 2024/09/06(金) 03:04:08.53 ID:MqTwQYNn >>27 >環境依存 この場合の「環境」って何? http://mevius.5ch.net/test/read.cgi/tech/1723861080/32
33: デフォルトの名無しさん [sage] 2024/09/07(土) 00:11:00.57 ID:AfmpIPHK 今って皆Unicode環境じゃん http://mevius.5ch.net/test/read.cgi/tech/1723861080/33
34: デフォルトの名無しさん [sage] 2024/09/07(土) 07:34:15.21 ID:G5zNb7Sx がフォントに全ての文字含まれているわけではない http://mevius.5ch.net/test/read.cgi/tech/1723861080/34
35: デフォルトの名無しさん [sage] 2024/09/07(土) 16:32:15.98 ID:8Mdqns08 今は標準のフォントで結構文字が入ってない? そこにNotoあたりでも足せば... No Tofuというぐらいで http://mevius.5ch.net/test/read.cgi/tech/1723861080/35
36: デフォルトの名無しさん [sage] 2024/09/08(日) 01:58:10.59 ID:ZMDGTsRQ 市販の日本語フォントはProフォントでも Adobe-Japan1-7 にある文字どまりで2万3千文字程度 Noto も国ごと文字種ごとにファイル分割されているのでフォント切り替えないと全ての文字は表示できない(あと新しく追加された文字はない いろいろ都合があって一つのフォントファイルに入れるのは最大でも6万字程度に抑えられてるのが実情 http://mevius.5ch.net/test/read.cgi/tech/1723861080/36
37: デフォルトの名無しさん [sage] 2024/09/08(日) 02:50:32.22 ID:sAB3C2kg なんでたまに中国の漢字が混ざるんかね 普通に使ってても混ざった事ないけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/37
38: デフォルトの名無しさん [sage] 2024/09/08(日) 05:25:42.70 ID:JPjEWE8J CJK統合漢字という黒歴史 中国が文句言ったせいで http://mevius.5ch.net/test/read.cgi/tech/1723861080/38
39: デフォルトの名無しさん [sage] 2024/09/08(日) 05:27:48.50 ID:vgBqrjWA >>36 囲み文字の話だろこれ。無理に話広げんなっちゅーの http://mevius.5ch.net/test/read.cgi/tech/1723861080/39
40: デフォルトの名無しさん [] 2024/09/08(日) 06:41:46.56 ID:VzCs41gF 文字列"c9" と"c10" 大小比較考察に、 数値9と10は、後者は、デカい有。さて 文字列のそれは、後者はデカく無アル? てか、wind○wsは、ファイル名並替順は ロジックは、意味は、ワカラン有る。 てか、豆腐文字□ぽぃのとか?はやめて、👻 に、豆腐文字ぽぃのは、統一してよ。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/40
41: デフォルトの名無しさん [sage] 2024/09/08(日) 09:04:47.02 ID:2kAAelOS 文字コードに国境がないと想像してみよう そんなに難しいことじゃない 争いや宗教がなくなり 全世界の人が平和に暮らせる 僕のことを夢想家だと言うかもしれないね http://mevius.5ch.net/test/read.cgi/tech/1723861080/41
42: デフォルトの名無しさん [sage] 2024/09/08(日) 09:41:19.87 ID:KGpMdTK5 とんでとんでとんでとんで まわってまわってまわってまわる http://mevius.5ch.net/test/read.cgi/tech/1723861080/42
43: デフォルトの名無しさん [sage] 2024/09/08(日) 10:09:45.56 ID:kvPGcLQN 日本語のソートはJISコード順じゃないと使い物にならないから内部でUnicodeからJISに変換しているという本末転倒感。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/43
44: デフォルトの名無しさん [sage] 2024/09/08(日) 15:01:05.20 ID:AApwAY5I 何で今までと順番が違うんだとか言われても面倒だからね 文句言う連中は文字コード云々なんて知らないだろうし http://mevius.5ch.net/test/read.cgi/tech/1723861080/44
45: デフォルトの名無しさん [sage] 2024/09/08(日) 16:55:41.96 ID:kvPGcLQN 今までと違うとか言う以前に、Unicodeのコードポイント順に整列しても意味不明だしね。 はっきり言って使い物にならない。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/45
46: デフォルトの名無しさん [sage] 2024/09/08(日) 19:11:11.78 ID:We5vf4ux Unicodeで数字とアルファベットはフォント違いや上付きや下付きの文字があって 丸囲みでもデザインの違いが何種類もあるよね こういう装飾的な物は文字コードの方でやるのか HTMLなどの別の規格でやるのかどっちがいいんだろうね 文字コードの方でやるとプレーンテキストでも 文を見やすくできるけど文字の検索がしづらくなるんだよね http://mevius.5ch.net/test/read.cgi/tech/1723861080/46
47: デフォルトの名無しさん [sage] 2024/09/09(月) 00:03:34.55 ID:7afCe/O3 >>46 最近は記号や絵文字とかまでを登録するようなってるので普通の文字じゃなかたりするのも多数ある 一見アラビア数字に見えても実際は飾り記号(dingbat)だったり数学記号(math symbol)だったりするのも多い (フォント違いに見えるのは数学記号) (同じ丸数字が複数あるように見えるのは修飾数字と飾り記号) 日本からだと全角数字とかフォントによって見かけだけ違うのもあるし http://mevius.5ch.net/test/read.cgi/tech/1723861080/47
48: デフォルトの名無しさん [] 2024/09/09(月) 18:01:55.88 ID:XsanjNXu >>37 日本語とはっきり設定していないから http://mevius.5ch.net/test/read.cgi/tech/1723861080/48
49: デフォルトの名無しさん [sage] 2024/09/09(月) 18:21:03.10 ID:zvC05GrM そういやアップル圏のアプリの実装って 濁点半濁点付きの平仮名片仮名はちゃんと表示できてるの? 折り返し処理だとかそういう所で http://mevius.5ch.net/test/read.cgi/tech/1723861080/49
50: デフォルトの名無しさん [] 2024/09/10(火) 13:15:25.32 ID:KGjTz1X0 アップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリアップル圏のアプリ http://mevius.5ch.net/test/read.cgi/tech/1723861080/50
51: デフォルトの名無しさん [sage] 2024/09/11(水) 22:23:26.91 ID:3H08skAT 「Unicode 16.0」が公開 〜エジプト象形文字、レガシーコンピューティング記号を大量追加 5,185の新たな文字が追加。総計で154,998文字に https://forest.watch.impress.co.jp/docs/news/1622857.html http://mevius.5ch.net/test/read.cgi/tech/1723861080/51
52: デフォルトの名無しさん [sage] 2024/09/15(日) 16:25:59.88 ID:FHCue4HF Windows環境では〜記号が波ダッシュより全角チルダの方で普及しているからなのか 日本語フォントでもフォントによっては全角チルダは表示できても波ダッシュは表示できなくて 波ダッシュが指定したフォントにならないなんて事がある http://mevius.5ch.net/test/read.cgi/tech/1723861080/52
53: デフォルトの名無しさん [sage] 2024/09/15(日) 17:44:02.92 ID:sX///73B >>52 駄目フォントじゃのぉ 全角チルダをちゃんとチルダっぽくして波ダッシュと全角チルダを見た目で区別つくようにして欲しいって言ったら 全角チルダを波ダッシュ代わりにしてるWindowsユーザーからクレームが来るから面倒って言われた記憶 http://mevius.5ch.net/test/read.cgi/tech/1723861080/53
54: デフォルトの名無しさん [sage] 2024/09/16(月) 01:40:24.33 ID:oxExUg4f >>51 キャラクタベースの画面でインベーダーやパックマンができるようになるのか、胸熱 http://mevius.5ch.net/test/read.cgi/tech/1723861080/54
55: デフォルトの名無しさん [sage] 2024/09/16(月) 01:40:40.50 ID:oxExUg4f しかしこのレガシーコンピューティングの部分の多角形とかって持ってるフォントある? https://en.wikipedia.org/wiki/Symbols_for_Legacy_Computing 以前アプリを作ってた時にこの手のマークがあるなら是非使いたかったのだが なさそうだったので自前でアイコンを作って表示した記憶が http://mevius.5ch.net/test/read.cgi/tech/1723861080/55
56: デフォルトの名無しさん [sage] 2024/09/16(月) 12:43:55.30 ID:nhODMZRh >>54 キャラジェネなんか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/56
57: デフォルトの名無しさん [] 2024/09/16(月) 15:24:54.46 ID:KZuryTv7 無能な働き者の集まり http://mevius.5ch.net/test/read.cgi/tech/1723861080/57
58: デフォルトの名無しさん [sage] 2024/09/28(土) 18:32:55.92 ID:1d8NABxz >>51 Game spritesやIconsのリファレンス元が知りたい Symbols for Legacy Computing Supplement ttps://www.unicode.org/charts/PDF/Unicode-16.0/U160-1CC00.pdf http://mevius.5ch.net/test/read.cgi/tech/1723861080/58
59: デフォルトの名無しさん [sage] 2024/09/30(月) 10:07:18.32 ID:4t7Lwjtc >>58 インベーダーっぽいのは「ALIEN CRAB」(異星カニ)、パックマンっぽいのは 「SNAKE」(ヘビ)等、固有名を避けあくまでも一般的なものとして逃げようとする 姿勢が見える http://mevius.5ch.net/test/read.cgi/tech/1723861080/59
60: デフォルトの名無しさん [] 2024/10/02(水) 19:07:49.51 ID:C0WilfCa ソリッドスネーク http://mevius.5ch.net/test/read.cgi/tech/1723861080/60
61: デフォルトの名無しさん [sage] 2024/10/05(土) 09:08:51.82 ID:WFnL/JH1 ソリッドステートサバイバー + スネークマンショー http://mevius.5ch.net/test/read.cgi/tech/1723861080/61
62: デフォルトの名無しさん [sage] 2024/10/06(日) 11:23:06.85 ID:BDyILJJL なんつーか、PCGだなあ。 今更だけど。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/62
63: デフォルトの名無しさん [sage] 2024/10/06(日) 17:40:48.86 ID:ALnpv1f2 横1列のドットパターンでコード割り当てて 合成も拡張して縦に並べられるとええかも http://mevius.5ch.net/test/read.cgi/tech/1723861080/63
64: デフォルトの名無しさん [sage] 2024/10/10(木) 12:19:57.72 ID:bwO1aVtU YMOと描いてイモと読む http://mevius.5ch.net/test/read.cgi/tech/1723861080/64
65: デフォルトの名無しさん [sage] 2024/10/13(日) 00:25:25.74 ID:VNPRmq36 YMO欽トリオ... テクノな曲あったよな http://mevius.5ch.net/test/read.cgi/tech/1723861080/65
66: デフォルトの名無しさん [] 2024/11/08(金) 16:40:13.45 ID:M93pzeOZ 「U+〜」の表記法って正式な名称ないの?「Short Identifier」? http://mevius.5ch.net/test/read.cgi/tech/1723861080/66
67: デフォルトの名無しさん [sage] 2024/11/08(金) 17:06:55.65 ID:TFeZf1kn https://www.unicode.org/versions/Unicode16.0.0/core-spec/appendix-a/#G12668 ないんでコードポイント表記とか http://mevius.5ch.net/test/read.cgi/tech/1723861080/67
68: デフォルトの名無しさん [] 2024/11/08(金) 18:20:23.07 ID:y8v+DuF6 >>66 そもそもUTF-8はその表記が正式な表記だから、表記の名称が存在しない。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/68
69: デフォルトの名無しさん [sage] 2024/11/09(土) 19:37:18.98 ID:otPYdJdQ 天皇に名字がないようのなものか? って違うか http://mevius.5ch.net/test/read.cgi/tech/1723861080/69
70: デフォルトの名無しさん [sage] 2024/11/09(土) 20:43:59.20 ID:UMsfYHki 回答ありがとう。表記法や表現自体には特には名前ないんか。 正規表現のグループに名前を付けようとして 「(?<UnicodeCodePoint>(?<Prefix>U\+)(?<Hex>[0-9A-F]{4,6}))」 みたいにしたんだけど、 「U+HHHH」全体をコードポイントって呼んでいいのか、 「HHHH」部分だけがコードポイントと呼べるものなのか、 っていう疑問が湧いたんだよね。 調べたらすぐ分かるかと思ったら全然分からなくてモヤモヤしてた。 http://mevius.5ch.net/test/read.cgi/te
ch/1723861080/70
71: デフォルトの名無しさん [sage] 2024/11/09(土) 23:09:52.15 ID:OjNPz0/0 >>70 xxxx がコードポイント(code point) U+xxxx がコードポイント表記 (code point notation) とかで良いんじゃね 知らんけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/71
72: デフォルトの名無しさん [sage] 2024/11/09(土) 23:59:10.46 ID:aDTWwhb+ 0xBEEFとBEEFは表現は違うけどどちらも16進表記で指してる値は同じ 10進表記の48879も同じ値を指す Unicodeのコードポイントってのは値を指してる だからなんやねんだけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/72
73: デフォルトの名無しさん [] 2024/11/10(日) 02:50:29.80 ID:NcxfIIMm >>70 「U+」の部分はUTF-8だという意味 http://mevius.5ch.net/test/read.cgi/tech/1723861080/73
74: デフォルトの名無しさん [sage] 2024/11/10(日) 03:16:28.77 ID:c/95e8WD >>73 コードポイントとエンコードの区別が付かない男の人って http://mevius.5ch.net/test/read.cgi/tech/1723861080/74
75: デフォルトの名無しさん [] 2024/11/10(日) 12:29:54.80 ID:AfmJKCJ3 >>68 ≒ >>73 これはひどい http://mevius.5ch.net/test/read.cgi/tech/1723861080/75
76: デフォルトの名無しさん [sage] 2024/11/10(日) 16:10:50.24 ID:DLtuPbgG Cスレの通りにやって文字出力したら化けるんだけど、文字コード民的な正しい対処法は? ちゃんとソースファイルがUTF-8なのは確認した https://mevius.5ch.net/test/read.cgi/tech/1721137434/350 #include <windows.h> int main(void) { LPTSTR lptStr = TEXT("テスト😊"); printf("%s\n", lptStr); } http://mevius.5ch.net/test/read.cgi/tech/1723861080/76
77: デフォルトの名無しさん [sage] 2024/11/10(日) 16:20:39.17 ID:DLtuPbgG win32でのAやW、charとwchar_tの事は分かっていて Linux他でのクロスコンパイルを考えてwchar_tは使わずにUTF-8 everywhereで通しつつ puts("テスト😊"); が文字化けしない様にしたい 特定システムロケールは仮定せず ターミナルではchcp 65001してある 場合です http://mevius.5ch.net/test/read.cgi/tech/1723861080/77
78: デフォルトの名無しさん [sage] 2024/11/10(日) 16:47:24.57 ID:ZReNrF9P 端末がUTF-8非対応なのはないとして 出力をファイルへリダイレクトするかダンプして 想定どおりのバイト列か確認してみては? http://mevius.5ch.net/test/read.cgi/tech/1723861080/78
79: デフォルトの名無しさん [] 2024/11/10(日) 16:48:25.69 ID:IKmeMWRS C詳しくないんで、正しい対処法は知らんけど、どこの通りで手元で出力できた。 https://www.reddit.com/r/C_Programming/comments/1adv86p/how_do_i_print_a_penguin_emoji_in_c_language/?rdt=48269 http://mevius.5ch.net/test/read.cgi/tech/1723861080/79
80: デフォルトの名無しさん [sage] 2024/11/10(日) 16:48:33.88 ID:qC3Ky4ZL 分かってるならなんでLPTSTRから変換せずに使ってんの http://mevius.5ch.net/test/read.cgi/tech/1723861080/80
81: デフォルトの名無しさん [] 2024/11/10(日) 16:51:53.80 ID:IKmeMWRS 具体的な回答のリンクにできてなかったんで張り直し これの前半のほうやね https://www.reddit.com/r/C_Programming/comments/1adv86p/comment/kk5vdm1/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button http://mevius.5ch.net/test/read.cgi/tech/1723861080/81
82: デフォルトの名無しさん [sage] 2024/11/10(日) 17:29:55.58 ID:x8h1RQEe >>78-81 ありがとうございます putsで文字化けしていたのは、コマンドラインでソースutf-8指定したら文字化けは直りました だけど、引数が受け取れないですね #include <stdio.h> int main(int argc, char **argv) { puts("テスト0😊"); for (int i = 1; i < argc; i++) puts(argv[i]); } $ cl -utf-8 ConsoleApplication1.c $ ./ConsoleApplication1.exe テスト1😊 テスト2😊 テスト0😊 ???1?? ???2?? $ ./Co
nsoleApplication1.exe テスト1😊 テスト2😊 > out.txt $ cat out.txt テスト0😊 ???1?? ???2?? (システムロケールEnglishでの環境です) http://mevius.5ch.net/test/read.cgi/tech/1723861080/82
83: デフォルトの名無しさん [sage] 2024/11/10(日) 17:34:04.13 ID:x8h1RQEe デバッグで確認したところ、引数のテスト1😊 テスト2😊は受け取りの時点(argv[i])でアルファベット以外の各コードポイントが?になってます http://mevius.5ch.net/test/read.cgi/tech/1723861080/83
84: デフォルトの名無しさん [sage] 2024/11/10(日) 17:39:37.64 ID:x8h1RQEe WindowsTerminal MSYSTEM=UCRT64のMSYS2 bashです $ echo テスト1😊 テスト2😊 テスト1😊 テスト2😊 http://mevius.5ch.net/test/read.cgi/tech/1723861080/84
85: デフォルトの名無しさん [sage] 2024/11/10(日) 17:45:01.75 ID:x8h1RQEe $ gcc ConsoleApplication1.c $ ./a.exe テスト0😊 $ ./a.exe テスト1😊 テスト2😊 Error: Command line contains characters that are not supported in the active code page (1252). UTF8 everywhereは厳しいですかね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/85
86: デフォルトの名無しさん [sage] 2024/11/10(日) 19:10:18.70 ID:c/95e8WD WindowsでワイドキャラクタってのはUTF16LEのことだよ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/86
87: デフォルトの名無しさん [sage] 2024/11/10(日) 20:20:44.02 ID:+vLaBA7E UTF-8 everywhere行けました $ cat utf8.rc #include "winuser.h" CREATEPROCESS_MANIFEST_RESOURCE_ID RT_MANIFEST "utf8.manifest" $ cat utf8.manifest <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <assembly xmlns="urn:schemas-microsoft-com:asm.v1" manifestVersion="1.0" xmlns:asmv3="urn:schemas-microsoft-com:asm.v3"> <asmv3:application&
gt; <asmv3:windowsSettings xmlns="http://schemas.microsoft.com/SMI/2019/WindowsSettings"> <activeCodePage>UTF-8</activeCodePage> </asmv3:windowsSettings> </asmv3:application> </assembly> $ cl -utf-8 ConsoleApplication1.c $ mt.exe -nologo -manifest "utf8.manifest" -outputresource:"ConsoleApplication1.exe;#1" $ ./ConsoleApplication1.exe テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 $ windres --input utf8
.rc --output utf8.res --output-format=coff $ gcc ConsoleApplication1.c utf8.res $ ./a.exe テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 http://mevius.5ch.net/test/read.cgi/tech/1723861080/87
88: デフォルトの名無しさん [sage] 2024/11/10(日) 22:05:14.87 ID:ictCxOlF >>87 下記の手続きを適用したってことなのかな? Windows アプリで UTF-8 コード ページを使用する - Windows apps | Microsoft Learn https://learn.microsoft.com/ja-jp/windows/apps/design/globalizing/use-utf8-code-page http://mevius.5ch.net/test/read.cgi/tech/1723861080/88
89: デフォルトの名無しさん [sage] 2024/11/11(月) 06:32:20.07 ID:bzvUbbzk はい、検索して適当に拾ってきたのでxmlnsが微妙に違いますが同じことですね MinGW64ツールチェーンではutf8.rcを経由してマニフェスト埋め込みしてますが MSVCツールチェーンではその経路だとこうなります $ rc utf8.rc $ cl -utf-8 ConsoleApplication1.c utf8.res ついでにPythonでもやってみました $ cat ConsoleApplication1.py import sys print("テスト0😊") for s in sys.argv[1:]: print(s) $ python313.exe ConsoleApplication1.py テス
ト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 環境変数がセットされてたので強制的に空にしても問題ないようです $ PYTHONIOENCODING= PYTHONUTF8= python313.exe ConsoleApplication1.py テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 http://mevius.5ch.net/test/read.cgi/tech/1723861080/89
90: デフォルトの名無しさん [] 2024/11/11(月) 11:04:13.71 ID:RXw/cl7Z スレ汚しでしかない http://mevius.5ch.net/test/read.cgi/tech/1723861080/90
91: デフォルトの名無しさん [sage] 2024/11/11(月) 13:27:25.94 ID:ZQtGCGPy >>90 まあ、あの荒れそうな言語がユニコード引数でエラー出すからな http://mevius.5ch.net/test/read.cgi/tech/1723861080/91
92: デフォルトの名無しさん [sage] 2024/11/15(金) 23:15:52.91 ID:5CeogfbD >>73 コードはユニコード それをどうエンコーディングするかでUTF8やUTF16やUTF32などがある ネットの標準がUTF8に統一されてなって ファイルシステムでもUTF8に統一されつつあり プログラム内部でもほとんどの用途はそのまま透過的にUTF8が有利に 固定長で扱うUTF32はムダすぎで 可変長のUTF8は後ろからでも切れ目を間違えことなく 表示幅問題はUTF8/UTF32関係なく発生するため http://mevius.5ch.net/test/read.cgi/tech/1723861080/92
93: デフォルトの名無しさん [sage] 2024/11/17(日) 17:51:56.38 ID:4RtrNUdf >>92 >ファイルシステムでもUTF8に統一されつつあり 例を挙げてもらえますか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/93
94: デフォルトの名無しさん [sage] 2024/11/17(日) 18:35:05.90 ID:hkK5KPG+ >>93 Linux distro, MacOS, android, iOS,... 挙げ始めたが最近のリリースだと Windows 以外のメジャーどころは全部じゃね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/94
95: デフォルトの名無しさん [] 2024/11/18(月) 23:18:52.19 ID:cZsx9Sbk UTF-8は世界の誰もが好むわけではない。 どの民族もUTF-8の良いところと悪いところで悩んでいる http://mevius.5ch.net/test/read.cgi/tech/1723861080/95
96: デフォルトの名無しさん [] 2024/11/18(月) 23:20:18.92 ID:cZsx9Sbk >>94 勘違いしているけど、それらの製品でも区別して使う分けている。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/96
97: デフォルトの名無しさん [sage] 2024/11/20(水) 15:38:36.45 ID:84IcR/Q0 >>94 Linux (ext4) は、ファイルシステムとしてはエンコーディングは規定されてないのでは? ディストロやユーザーがUTF-8を使ったりするのは自由だが よってAndroidも同様 なんだAppleだけじゃんw http://mevius.5ch.net/test/read.cgi/tech/1723861080/97
98: デフォルトの名無しさん [sage] 2024/11/20(水) 16:37:13.78 ID:APWVo8Zw >>97 そんなこと言いだしたら APFS も NTFS も単にバイト列を記録してるのに過ぎない。 それをOSやライブラリとしてどう解釈するかがファイルシステムの文字列。 だから linux kernel でなくて linux distro の問題。 (もっとも最近の Linux kernel はデフォルトで UTF-8 を指定するABIとかあって文字コードの変換したりするけど。別問題) http://mevius.5ch.net/test/read.cgi/tech/1723861080/98
99: デフォルトの名無しさん [] 2024/11/21(木) 12:47:55.86 ID:SUxxkxcm UTF-8も完璧じゃないからな http://mevius.5ch.net/test/read.cgi/tech/1723861080/99
100: デフォルトの名無しさん [sage] 2024/11/21(木) 14:20:22.35 ID:GU8mH0bt >>99 キミの言う「完璧」とは一体... http://mevius.5ch.net/test/read.cgi/tech/1723861080/100
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 362 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.020s