文字コード総合スレ part15 (472レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
63: デフォルトの名無しさん [sage] 2024/10/06(日) 17:40:48.86 ID:ALnpv1f2 横1列のドットパターンでコード割り当てて 合成も拡張して縦に並べられるとええかも http://mevius.5ch.net/test/read.cgi/tech/1723861080/63
64: デフォルトの名無しさん [sage] 2024/10/10(木) 12:19:57.72 ID:bwO1aVtU YMOと描いてイモと読む http://mevius.5ch.net/test/read.cgi/tech/1723861080/64
65: デフォルトの名無しさん [sage] 2024/10/13(日) 00:25:25.74 ID:VNPRmq36 YMO欽トリオ... テクノな曲あったよな http://mevius.5ch.net/test/read.cgi/tech/1723861080/65
66: デフォルトの名無しさん [] 2024/11/08(金) 16:40:13.45 ID:M93pzeOZ 「U+〜」の表記法って正式な名称ないの?「Short Identifier」? http://mevius.5ch.net/test/read.cgi/tech/1723861080/66
67: デフォルトの名無しさん [sage] 2024/11/08(金) 17:06:55.65 ID:TFeZf1kn https://www.unicode.org/versions/Unicode16.0.0/core-spec/appendix-a/#G12668 ないんでコードポイント表記とか http://mevius.5ch.net/test/read.cgi/tech/1723861080/67
68: デフォルトの名無しさん [] 2024/11/08(金) 18:20:23.07 ID:y8v+DuF6 >>66 そもそもUTF-8はその表記が正式な表記だから、表記の名称が存在しない。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/68
69: デフォルトの名無しさん [sage] 2024/11/09(土) 19:37:18.98 ID:otPYdJdQ 天皇に名字がないようのなものか? って違うか http://mevius.5ch.net/test/read.cgi/tech/1723861080/69
70: デフォルトの名無しさん [sage] 2024/11/09(土) 20:43:59.20 ID:UMsfYHki 回答ありがとう。表記法や表現自体には特には名前ないんか。 正規表現のグループに名前を付けようとして 「(?<UnicodeCodePoint>(?<Prefix>U\+)(?<Hex>[0-9A-F]{4,6}))」 みたいにしたんだけど、 「U+HHHH」全体をコードポイントって呼んでいいのか、 「HHHH」部分だけがコードポイントと呼べるものなのか、 っていう疑問が湧いたんだよね。 調べたらすぐ分かるかと思ったら全然分からなくてモヤモヤしてた。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/70
71: デフォルトの名無しさん [sage] 2024/11/09(土) 23:09:52.15 ID:OjNPz0/0 >>70 xxxx がコードポイント(code point) U+xxxx がコードポイント表記 (code point notation) とかで良いんじゃね 知らんけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/71
72: デフォルトの名無しさん [sage] 2024/11/09(土) 23:59:10.46 ID:aDTWwhb+ 0xBEEFとBEEFは表現は違うけどどちらも16進表記で指してる値は同じ 10進表記の48879も同じ値を指す Unicodeのコードポイントってのは値を指してる だからなんやねんだけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/72
73: デフォルトの名無しさん [] 2024/11/10(日) 02:50:29.80 ID:NcxfIIMm >>70 「U+」の部分はUTF-8だという意味 http://mevius.5ch.net/test/read.cgi/tech/1723861080/73
74: デフォルトの名無しさん [sage] 2024/11/10(日) 03:16:28.77 ID:c/95e8WD >>73 コードポイントとエンコードの区別が付かない男の人って http://mevius.5ch.net/test/read.cgi/tech/1723861080/74
75: デフォルトの名無しさん [] 2024/11/10(日) 12:29:54.80 ID:AfmJKCJ3 >>68 ≒ >>73 これはひどい http://mevius.5ch.net/test/read.cgi/tech/1723861080/75
76: デフォルトの名無しさん [sage] 2024/11/10(日) 16:10:50.24 ID:DLtuPbgG Cスレの通りにやって文字出力したら化けるんだけど、文字コード民的な正しい対処法は? ちゃんとソースファイルがUTF-8なのは確認した https://mevius.5ch.net/test/read.cgi/tech/1721137434/350 #include <windows.h> int main(void) { LPTSTR lptStr = TEXT("テスト😊"); printf("%s\n", lptStr); } http://mevius.5ch.net/test/read.cgi/tech/1723861080/76
77: デフォルトの名無しさん [sage] 2024/11/10(日) 16:20:39.17 ID:DLtuPbgG win32でのAやW、charとwchar_tの事は分かっていて Linux他でのクロスコンパイルを考えてwchar_tは使わずにUTF-8 everywhereで通しつつ puts("テスト😊"); が文字化けしない様にしたい 特定システムロケールは仮定せず ターミナルではchcp 65001してある 場合です http://mevius.5ch.net/test/read.cgi/tech/1723861080/77
78: デフォルトの名無しさん [sage] 2024/11/10(日) 16:47:24.57 ID:ZReNrF9P 端末がUTF-8非対応なのはないとして 出力をファイルへリダイレクトするかダンプして 想定どおりのバイト列か確認してみては? http://mevius.5ch.net/test/read.cgi/tech/1723861080/78
79: デフォルトの名無しさん [] 2024/11/10(日) 16:48:25.69 ID:IKmeMWRS C詳しくないんで、正しい対処法は知らんけど、どこの通りで手元で出力できた。 https://www.reddit.com/r/C_Programming/comments/1adv86p/how_do_i_print_a_penguin_emoji_in_c_language/?rdt=48269 http://mevius.5ch.net/test/read.cgi/tech/1723861080/79
80: デフォルトの名無しさん [sage] 2024/11/10(日) 16:48:33.88 ID:qC3Ky4ZL 分かってるならなんでLPTSTRから変換せずに使ってんの http://mevius.5ch.net/test/read.cgi/tech/1723861080/80
81: デフォルトの名無しさん [] 2024/11/10(日) 16:51:53.80 ID:IKmeMWRS 具体的な回答のリンクにできてなかったんで張り直し これの前半のほうやね https://www.reddit.com/r/C_Programming/comments/1adv86p/comment/kk5vdm1/?utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button http://mevius.5ch.net/test/read.cgi/tech/1723861080/81
82: デフォルトの名無しさん [sage] 2024/11/10(日) 17:29:55.58 ID:x8h1RQEe >>78-81 ありがとうございます putsで文字化けしていたのは、コマンドラインでソースutf-8指定したら文字化けは直りました だけど、引数が受け取れないですね #include <stdio.h> int main(int argc, char **argv) { puts("テスト0😊"); for (int i = 1; i < argc; i++) puts(argv[i]); } $ cl -utf-8 ConsoleApplication1.c $ ./ConsoleApplication1.exe テスト1😊 テスト2😊 テスト0😊 ???1?? ???2?? $ ./ConsoleApplication1.exe テスト1😊 テスト2😊 > out.txt $ cat out.txt テスト0😊 ???1?? ???2?? (システムロケールEnglishでの環境です) http://mevius.5ch.net/test/read.cgi/tech/1723861080/82
83: デフォルトの名無しさん [sage] 2024/11/10(日) 17:34:04.13 ID:x8h1RQEe デバッグで確認したところ、引数のテスト1😊 テスト2😊は受け取りの時点(argv[i])でアルファベット以外の各コードポイントが?になってます http://mevius.5ch.net/test/read.cgi/tech/1723861080/83
84: デフォルトの名無しさん [sage] 2024/11/10(日) 17:39:37.64 ID:x8h1RQEe WindowsTerminal MSYSTEM=UCRT64のMSYS2 bashです $ echo テスト1😊 テスト2😊 テスト1😊 テスト2😊 http://mevius.5ch.net/test/read.cgi/tech/1723861080/84
85: デフォルトの名無しさん [sage] 2024/11/10(日) 17:45:01.75 ID:x8h1RQEe $ gcc ConsoleApplication1.c $ ./a.exe テスト0😊 $ ./a.exe テスト1😊 テスト2😊 Error: Command line contains characters that are not supported in the active code page (1252). UTF8 everywhereは厳しいですかね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/85
86: デフォルトの名無しさん [sage] 2024/11/10(日) 19:10:18.70 ID:c/95e8WD WindowsでワイドキャラクタってのはUTF16LEのことだよ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/86
87: デフォルトの名無しさん [sage] 2024/11/10(日) 20:20:44.02 ID:+vLaBA7E UTF-8 everywhere行けました $ cat utf8.rc #include "winuser.h" CREATEPROCESS_MANIFEST_RESOURCE_ID RT_MANIFEST "utf8.manifest" $ cat utf8.manifest <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <assembly xmlns="urn:schemas-microsoft-com:asm.v1" manifestVersion="1.0" xmlns:asmv3="urn:schemas-microsoft-com:asm.v3"> <asmv3:application> <asmv3:windowsSettings xmlns="http://schemas.microsoft.com/SMI/2019/WindowsSettings"> <activeCodePage>UTF-8</activeCodePage> </asmv3:windowsSettings> </asmv3:application> </assembly> $ cl -utf-8 ConsoleApplication1.c $ mt.exe -nologo -manifest "utf8.manifest" -outputresource:"ConsoleApplication1.exe;#1" $ ./ConsoleApplication1.exe テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 $ windres --input utf8.rc --output utf8.res --output-format=coff $ gcc ConsoleApplication1.c utf8.res $ ./a.exe テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 http://mevius.5ch.net/test/read.cgi/tech/1723861080/87
88: デフォルトの名無しさん [sage] 2024/11/10(日) 22:05:14.87 ID:ictCxOlF >>87 下記の手続きを適用したってことなのかな? Windows アプリで UTF-8 コード ページを使用する - Windows apps | Microsoft Learn https://learn.microsoft.com/ja-jp/windows/apps/design/globalizing/use-utf8-code-page http://mevius.5ch.net/test/read.cgi/tech/1723861080/88
89: デフォルトの名無しさん [sage] 2024/11/11(月) 06:32:20.07 ID:bzvUbbzk はい、検索して適当に拾ってきたのでxmlnsが微妙に違いますが同じことですね MinGW64ツールチェーンではutf8.rcを経由してマニフェスト埋め込みしてますが MSVCツールチェーンではその経路だとこうなります $ rc utf8.rc $ cl -utf-8 ConsoleApplication1.c utf8.res ついでにPythonでもやってみました $ cat ConsoleApplication1.py import sys print("テスト0😊") for s in sys.argv[1:]: print(s) $ python313.exe ConsoleApplication1.py テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 環境変数がセットされてたので強制的に空にしても問題ないようです $ PYTHONIOENCODING= PYTHONUTF8= python313.exe ConsoleApplication1.py テスト1😊 テスト2😊 テスト0😊 テスト1😊 テスト2😊 http://mevius.5ch.net/test/read.cgi/tech/1723861080/89
90: デフォルトの名無しさん [] 2024/11/11(月) 11:04:13.71 ID:RXw/cl7Z スレ汚しでしかない http://mevius.5ch.net/test/read.cgi/tech/1723861080/90
91: デフォルトの名無しさん [sage] 2024/11/11(月) 13:27:25.94 ID:ZQtGCGPy >>90 まあ、あの荒れそうな言語がユニコード引数でエラー出すからな http://mevius.5ch.net/test/read.cgi/tech/1723861080/91
92: デフォルトの名無しさん [sage] 2024/11/15(金) 23:15:52.91 ID:5CeogfbD >>73 コードはユニコード それをどうエンコーディングするかでUTF8やUTF16やUTF32などがある ネットの標準がUTF8に統一されてなって ファイルシステムでもUTF8に統一されつつあり プログラム内部でもほとんどの用途はそのまま透過的にUTF8が有利に 固定長で扱うUTF32はムダすぎで 可変長のUTF8は後ろからでも切れ目を間違えことなく 表示幅問題はUTF8/UTF32関係なく発生するため http://mevius.5ch.net/test/read.cgi/tech/1723861080/92
93: デフォルトの名無しさん [sage] 2024/11/17(日) 17:51:56.38 ID:4RtrNUdf >>92 >ファイルシステムでもUTF8に統一されつつあり 例を挙げてもらえますか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/93
94: デフォルトの名無しさん [sage] 2024/11/17(日) 18:35:05.90 ID:hkK5KPG+ >>93 Linux distro, MacOS, android, iOS,... 挙げ始めたが最近のリリースだと Windows 以外のメジャーどころは全部じゃね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/94
95: デフォルトの名無しさん [] 2024/11/18(月) 23:18:52.19 ID:cZsx9Sbk UTF-8は世界の誰もが好むわけではない。 どの民族もUTF-8の良いところと悪いところで悩んでいる http://mevius.5ch.net/test/read.cgi/tech/1723861080/95
96: デフォルトの名無しさん [] 2024/11/18(月) 23:20:18.92 ID:cZsx9Sbk >>94 勘違いしているけど、それらの製品でも区別して使う分けている。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/96
97: デフォルトの名無しさん [sage] 2024/11/20(水) 15:38:36.45 ID:84IcR/Q0 >>94 Linux (ext4) は、ファイルシステムとしてはエンコーディングは規定されてないのでは? ディストロやユーザーがUTF-8を使ったりするのは自由だが よってAndroidも同様 なんだAppleだけじゃんw http://mevius.5ch.net/test/read.cgi/tech/1723861080/97
98: デフォルトの名無しさん [sage] 2024/11/20(水) 16:37:13.78 ID:APWVo8Zw >>97 そんなこと言いだしたら APFS も NTFS も単にバイト列を記録してるのに過ぎない。 それをOSやライブラリとしてどう解釈するかがファイルシステムの文字列。 だから linux kernel でなくて linux distro の問題。 (もっとも最近の Linux kernel はデフォルトで UTF-8 を指定するABIとかあって文字コードの変換したりするけど。別問題) http://mevius.5ch.net/test/read.cgi/tech/1723861080/98
99: デフォルトの名無しさん [] 2024/11/21(木) 12:47:55.86 ID:SUxxkxcm UTF-8も完璧じゃないからな http://mevius.5ch.net/test/read.cgi/tech/1723861080/99
100: デフォルトの名無しさん [sage] 2024/11/21(木) 14:20:22.35 ID:GU8mH0bt >>99 キミの言う「完璧」とは一体... http://mevius.5ch.net/test/read.cgi/tech/1723861080/100
101: デフォルトの名無しさん [sage] 2024/11/21(木) 15:46:00.53 ID:/Qk0W5ej >>98 >そんなこと言いだしたら APFS も NTFS も単にバイト列を記録してるのに過ぎない。 いいえ http://mevius.5ch.net/test/read.cgi/tech/1723861080/101
102: デフォルトの名無しさん [] 2024/12/01(日) 10:32:32.38 ID:RvSn0UL0 UTF8を推しているのは形を変えたASCII信者の老害。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/102
103: デフォルトの名無しさん [sage] 2024/12/01(日) 11:15:01.77 ID:iESkoZBr 刷新できていない古いシステムを除くと 文字コードはユニコードになったね エンコーディングはネット上がUTF8なので それをそのまま扱うのが一般的となったね http://mevius.5ch.net/test/read.cgi/tech/1723861080/103
104: デフォルトの名無しさん [sage] 2024/12/01(日) 12:39:57.84 ID:8fzBRjbp UTF-8 より完璧な文字コードって何だい? ASCII と SJIS と UTF-8 はいいねしたい http://mevius.5ch.net/test/read.cgi/tech/1723861080/104
105: デフォルトの名無しさん [sage] 2024/12/01(日) 20:40:24.45 ID:NnL6xx/e なんか色々ごっちゃだな http://mevius.5ch.net/test/read.cgi/tech/1723861080/105
106: デフォルトの名無しさん [sage] 2024/12/02(月) 03:35:11.02 ID:okRPdXGy 元のユニコードがクソだからなあ 結局どうにもならなくなって異体字セレクタとか出てくるし http://mevius.5ch.net/test/read.cgi/tech/1723861080/106
107: デフォルトの名無しさん [] 2024/12/02(月) 13:49:05.08 ID:Zd1R379W ishの出力ってSJISが標準? utf-8板のish欲しいと思ったけど -Dutf8付けてコンパイルしても結局SJIS出力だった http://mevius.5ch.net/test/read.cgi/tech/1723861080/107
108: デフォルトの名無しさん [sage] 2024/12/02(月) 14:10:00.90 ID:n2j6TE+S バイトデータで出力してるだけでエンコーディング関係ないような UTF-8対応してもバイト単位でみたら7ビットしか情報持てないから損 効率気にしないならコード変換したらいい 半角カナが3バイトになるけどエラー訂正なんかは使える http://mevius.5ch.net/test/read.cgi/tech/1723861080/108
109: デフォルトの名無しさん [sage] 2024/12/03(火) 12:52:43.59 ID:DZc+/1dr たまたまSJISでデコードしたら人間に読める(かもしれない)ってだけで 只のバイナリデータだよね http://mevius.5ch.net/test/read.cgi/tech/1723861080/109
110: デフォルトの名無しさん [sage] 2024/12/04(水) 23:36:37.56 ID:9B20CEFA SJISとして不正なバイト列は含まれないはず http://mevius.5ch.net/test/read.cgi/tech/1723861080/110
111: デフォルトの名無しさん [sage] 2024/12/05(木) 16:18:11.64 ID:riH9D2sC ファイル名がユニコードだと、 例えば2つのファイル名が同一かどうかの判定は、2つのユニコード列が同一かどうかの 判定をしなくてはならない。この場合の同一とはなんだろう。めんどくさい http://mevius.5ch.net/test/read.cgi/tech/1723861080/111
112: デフォルトの名無しさん [sage] 2024/12/05(木) 16:59:22.16 ID:jrS77sb5 >>111 「ユニコード列」みたいな曖昧な用語で考えると曖昧な結果にしかならなんわな http://mevius.5ch.net/test/read.cgi/tech/1723861080/112
113: デフォルトの名無しさん [sage] 2024/12/05(木) 17:16:36.01 ID:jrS77sb5 「ファイル名」という用語に限ってもOSごとに異なる意味をもち、「バイト列/コードポイント表現」(Linux/Windows)と「 unicode 正規化表現」(MacOS)のどっちのやり方もあるし unicode の正規化には複数の種類がある http://mevius.5ch.net/test/read.cgi/tech/1723861080/113
114: デフォルトの名無しさん [] 2024/12/05(木) 19:21:14.57 ID:f+d6ZP2R >>103 ネットはJISもあるから、そう簡単な話ではない。 EメールだとまだJISが主流。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/114
115: デフォルトの名無しさん [] 2024/12/05(木) 19:22:28.03 ID:f+d6ZP2R >>113 Macのせいで記号や改行コードの解釈がめちゃくちゃになった。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/115
116: デフォルトの名無しさん [sage] 2024/12/05(木) 22:25:20.82 ID:Kc+yIq6Q >>111はあえて雑に書いてあるんだが(めんどくさいからw) >>113は「曖昧じゃない」んだ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/116
117: デフォルトの名無しさん [sage] 2024/12/05(木) 23:11:23.50 ID:+y5lu+gF 見苦しいぞ http://mevius.5ch.net/test/read.cgi/tech/1723861080/117
118: デフォルトの名無しさん [] 2024/12/06(金) 10:53:27.12 ID:zw4qy2EX ハンカクカタカナ.txtと ハンカクカタカナ.txtは 区別されると困るか区別して欲しいかは個人の好みだな http://mevius.5ch.net/test/read.cgi/tech/1723861080/118
119: デフォルトの名無しさん [sage] 2024/12/06(金) 11:15:10.72 ID:kzR0LSsc >>111,118 主観と好みの問題だから、現状がそれを孕んでいるかどうか心配ならNKFCで突合チェックしたら良いだけかな http://mevius.5ch.net/test/read.cgi/tech/1723861080/119
120: デフォルトの名無しさん [sage] 2024/12/06(金) 13:01:51.55 ID:tlsLperd >>118 自分はまったく別物だろうという考えだが、逆にそれを同じと思う人がいるというのに驚きだ http://mevius.5ch.net/test/read.cgi/tech/1723861080/120
121: デフォルトの名無しさん [sage] 2024/12/06(金) 14:57:12.37 ID:PqgirqmV MacOS/iOS だと OS 的にファイル名はNFD強制なのでその2つ区別できないのが普通だな Macユーザーは「半角カナはファイル名には使えない」という言い方してることが多いけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/121
122: デフォルトの名無しさん [sage] 2024/12/06(金) 15:08:33.92 ID:teqNcVuG Windowsは大文字小文字の区別を付けないのがデフォルトなんだけど、 WSL内からアクセスする兼ね合いで区別設定できる(fsutil) >>121 Macにも同様の理由でNFD強制解除の設定があるのでは? http://mevius.5ch.net/test/read.cgi/tech/1723861080/122
123: デフォルトの名無しさん [sage] 2024/12/06(金) 17:09:11.54 ID:PqgirqmV >>122 強制解除とかはなかったと思うが古い HFS+ と違って新しい APFS では論理的には書き込み可能なはず 一方でライブラリで、ファイルオープンする時にファイル名が強制的にNFD変換されるので通常のプログラムでは全部NFDになるのは避けられない http://mevius.5ch.net/test/read.cgi/tech/1723861080/123
124: デフォルトの名無しさん [sage] 2024/12/06(金) 20:10:41.64 ID:77CvoLMD Macが一番遅れているのは意外だな > Mac で NAS (SMB) のファイルが見えない問題を Unicode 正規化方式を変えて解決 > Unicode 正規化方式として NFD を採用しているのは Mac なのに,SMB (NAS) を介してみると当の Mac だけがそういったファイルを認識できない(ことがある)というのはなんとも皮肉な結果ですね...。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/124
125: デフォルトの名無しさん [sage] 2024/12/06(金) 21:07:04.96 ID:PqgirqmV >>124 Mac はローカルファイルは NFD (っぽい独自仕様)で正規化されてる前提で、リモートのSMBの先は NFC (っぽい独自仕様)で正規化されている前提で動作するという謎仕様なので Lunux は基本的に正規化されずに全部別の文字扱いで unicode の全文字が使える Windows も基本的には正規化を前提にしていないが独自仕様の使えない文字がある http://mevius.5ch.net/test/read.cgi/tech/1723861080/125
126: デフォルトの名無しさん [sage] 2024/12/06(金) 21:22:50.16 ID:XSDLieo6 わかりやすいようにたとえで説明するとさ、 オマエんちに人を招待したら、土足のまま上がってきた オマエはイラっとするんじゃね? はいオマエ遅れてる〜 http://mevius.5ch.net/test/read.cgi/tech/1723861080/126
127: デフォルトの名無しさん [sage] 2024/12/06(金) 21:35:56.15 ID:PqgirqmV 服装カジュアルな場所でも常にスーツ着てきてスーツ着てないやつは家族だろうと友人だろうと全員無視するのが Mac 仕草 その上、自宅用と訪問用に別の種類のスーツを使い分けてて同じ種類のスーツ着てないと相手してくれない http://mevius.5ch.net/test/read.cgi/tech/1723861080/127
128: デフォルトの名無しさん [sage] 2024/12/07(土) 10:53:50.76 ID:+zec5U9G UnicodeはUnicodeで様々な言語の様々な表現ができるようにするなかで一意性についても 用途や目的によって方法は異なるとしているわけで、そもそもファイルをファイル名で特定するという 昔ながらのやり方との齟齬が出てきているのかもね。 使うなら使うでファイルシステムに用いる正規化ルールなどを定めなければならないんだろう。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/128
129: デフォルトの名無しさん [sage] 2024/12/07(土) 11:21:31.79 ID:RCmjilK5 同一性やコロケーション問題として path-win-ntfs、path-linux-ext4のようにunicodeでpath-localeを定めてicu実装されたら良いのにと思った事はあったけど、 それで他の方法が駆逐されるわけじゃなく新たなバリエーションを増やすだけだから、今は余計な事するなと思うよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/129
130: デフォルトの名無しさん [sage] 2024/12/07(土) 11:21:45.13 ID:prVW7qhX >>128 ファイル名はOS的には単なる識別子なのでバイト列一致で良い それを文字コードと絡めて正規化しようとするのがそもそもの間違い バイト列をどのように解釈するかは別のレイヤーの問題 http://mevius.5ch.net/test/read.cgi/tech/1723861080/130
131: デフォルトの名無しさん [sage] 2024/12/07(土) 11:44:07.08 ID:3wlpERVS FSとしてならそれでいい OSをどの層までとするかでも変わってくるけど マウント時に変換かけてOS間の相互運用気にしてほしい ネットワーク透過考えるとパスはURIで扱いたいしね http://mevius.5ch.net/test/read.cgi/tech/1723861080/131
132: デフォルトの名無しさん [sage] 2024/12/07(土) 13:08:36.00 ID:prVW7qhX >>131 基本的にはアプリ側のライブラリ層でやるべきこと OS標準ライブラリかユーザ追加ライブラリかはOSの思想によるし Linux とかだとOS標準ライブラリという考え方は縁遠いけど マウントの時にファイルシステムで文字コード変換するのも否定しないけど、あくまで代替手段なので、固定ではなくオプションや設定で利用者で任意に変更できるべきもの http://mevius.5ch.net/test/read.cgi/tech/1723861080/132
133: デフォルトの名無しさん [] 2024/12/07(土) 14:01:25.11 ID:8ekNK8XT >他の方法が駆逐されるわけじゃなく新たなバリエーションを増やすだけ ほんそれ http://mevius.5ch.net/test/read.cgi/tech/1723861080/133
134: デフォルトの名無しさん [sage] 2024/12/07(土) 14:17:40.72 ID:Zwl6oBBL まずはMacを駆逐しよう http://mevius.5ch.net/test/read.cgi/tech/1723861080/134
135: デフォルトの名無しさん [sage] 2024/12/07(土) 16:00:13.39 ID:2Ddhf3xH Mac で日本語を駆逐でいいんじゃね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/135
136: デフォルトの名無しさん [sage] 2024/12/07(土) 21:42:37.76 ID:1sWZyE4C ファイル名にはASCIIにある文字しか使わないようにすれば解決 http://mevius.5ch.net/test/read.cgi/tech/1723861080/136
137: デフォルトの名無しさん [sage] 2024/12/07(土) 21:44:45.68 ID:prVW7qhX >>136 ASCII のバックスラッシュが円記号になってしまう OS がるらしい http://mevius.5ch.net/test/read.cgi/tech/1723861080/137
138: デフォルトの名無しさん [sage] 2024/12/08(日) 03:07:43.02 ID:h9KuPnHR >>136 じゃあまずはASCII以外でここに書き込むのやめろよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/138
139: デフォルトの名無しさん [sage] 2024/12/08(日) 04:05:29.89 ID:Xxla/ZnP >>138 ここにファイル名を書いてる人あまりいないと思うんだけど? http://mevius.5ch.net/test/read.cgi/tech/1723861080/139
140: デフォルトの名無しさん [] 2024/12/09(月) 11:25:01.55 ID:uh4vUAM3 波ダッシュ(〜)と全角チルダ(〜)は違う文字 http://mevius.5ch.net/test/read.cgi/tech/1723861080/140
141: デフォルトの名無しさん [sage] 2024/12/09(月) 12:17:56.89 ID:Ne3E3UJU JISで全角チルダ定義したのがアレだよな 全角しか表示できない場面のためだろうけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/141
142: デフォルトの名無しさん [sage] 2024/12/09(月) 14:00:31.58 ID:4HU/GnaT >>141 JIS は全角と半角とか定義してない(定期 http://mevius.5ch.net/test/read.cgi/tech/1723861080/142
143: デフォルトの名無しさん [sage] 2024/12/09(月) 14:37:46.18 ID:+G8yezOA >>142 えー、をMSIMEで変換したら 全角チルダ(U+FF5E)でした 抑揚のある伸ばし棒はこれが正解ですか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/143
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 329 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.009s