文字コード総合スレ part15 (470レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
145: デフォルトの名無しさん [sage] 2024/12/09(月) 17:46:32.24 ID:bX1qj24S この板には表層的にMSを持ち出すだけで思考停止する若干一名がいるね http://mevius.5ch.net/test/read.cgi/tech/1723861080/145
146: デフォルトの名無しさん [sage] 2024/12/09(月) 18:34:12.95 ID:4HU/GnaT >>145 シフトJISの「波ダーシ」を unicode の「全角チルダ」にマッピングする CP932 を規定したのはマイクロソフト マイクロソフト以外の Linux とか MacOS とかその他の各社OSではそうなっていない マイクロソフトが何でこんなマッピングにしたのかは専門家でも分かんない謎 unicode がまだドラフトの時代にあわてて作業したのでミスっただけの可能性も指摘されてるが、一度決めたものは互換性のために変えられないのだろう点は理解できる http://mevius.5ch.net/test/read.cgi/tech/1723861080/146
147: デフォルトの名無しさん [sage] 2024/12/09(月) 23:51:59.27 ID:TvtcjS7H マイクロソフト憎しにも程がある デマだめ絶対 http://mevius.5ch.net/test/read.cgi/tech/1723861080/147
148: デフォルトの名無しさん [sage] 2024/12/13(金) 01:50:01.54 ID:XDI5kMlm マイクロソフトの場合親の敵の可能性があるから俺は許すね 気の済むまでじゃんじゃんやっといてくれ http://mevius.5ch.net/test/read.cgi/tech/1723861080/148
149: デフォルトの名無しさん [sage] 2024/12/13(金) 02:14:20.18 ID:OiDxg/7M unicode 規格が最初に作られた時サイトに参考情報として JIS と unicode のマッピング表が置いてあった Linux も Mac も商用Unixもこの表に従ってJISの波ダーシを unicode の wave dash にマッピングした。さらに JISの規格書にもこのマッピングで記載された ただ Microsoft 1社だけは JIS の波ダーシを unicode の fullwidth tilde にマッピングした こんなんマイクロソフトの中の人以外に理由が分かるわけねーだろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/149
150: デフォルトの名無しさん [sage] 2024/12/13(金) 11:09:50.07 ID:ncXjn+FF 初期のUnicode仕様書の文字の形がおかしかったのがそもそもの原因なんだけどね いまの仕様書では、〜(U+301C、波ダッシュ)は、~(U+FF5E、全角チルダ)と同じ字形だけど、 古いものは、上下反転した存在しない文字の形だったので、どちらに合わせるかを決める時点で、 MSは形の相似した全角チルダのU+FF5Eを、その他は仕様どおりの波ダッシュのU+301Cを割り当てた 更にMacは仕様書を無視して字形を変更し、現在の仕様書と同じようにU+301Cに本来の波ダッシュの形を割り当てた ただ、上下反転した字形は、縦書きの際の全角チルダ(左右の順)文字を横書きにしたために紛れ込んだとも言われているので、 仕様書制定の段階で縦書きのある日本語を理解した人が加わっていなかったのだろうな まぁ、仕様書の字形がおかしかったことがそもそもの原因ではあるけれど、 これの対応を話し合いをすることなく各社で独自に行なってしまったというのが一番大きいな 結局、日本語が軽んじられていたんだろうけど、なんとも間抜けな話 http://mevius.5ch.net/test/read.cgi/tech/1723861080/150
151: デフォルトの名無しさん [sage] 2024/12/13(金) 11:39:54.50 ID:OiDxg/7M >>150 仕様書も文字の形がおかしかったはネットの素人が勝手に推測した迷信、文字形は規定していない 文字コード的にはフォントで変わる文字の形は意味がない unicode の wave dash は JIS 第一水準の波ダージなどに対応する文字として準備された unicode の互換領域の fullwidth tilde は EUC-JP とかで使用されいたJIS補助漢字のチルダをマッピングするために準備された EUC-JP では ASCII の1バイト文字のチルダと補助漢字の2倍と文字のチルダに両方が使われていたので互換領域が必要だった http://mevius.5ch.net/test/read.cgi/tech/1723861080/151
152: デフォルトの名無しさん [sage] 2025/01/11(土) 13:26:51.55 ID:ftPdDy1W なんか文字コード絡みでWindowsに特大級のセキュリティホールが見つかったぽい https://blog.orange.tw/posts/2025-01-worstfit-unveiling-hidden-transformers-in-windows-ansi/ http://mevius.5ch.net/test/read.cgi/tech/1723861080/152
153: デフォルトの名無しさん [] 2025/01/11(土) 13:36:00.86 ID:ftPdDy1W CP65001で緩和可能ってことであってるよね? 超ヤバげなんでageるよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/153
154: デフォルトの名無しさん [sage] 2025/01/11(土) 13:52:24.87 ID:wkEhpAnW >>153 あってる MSYS2を使ってれば2,3ヶ月前には対策の副作用があったから知ってたよ メディアはもっとこれを大きく報じてユーザー環境にもUTF8ロケールが広まって欲しい http://mevius.5ch.net/test/read.cgi/tech/1723861080/154
155: デフォルトの名無しさん [sage] 2025/01/11(土) 15:04:27.58 ID:mk8LdH4O やべーやつだこれ 終わったな... http://mevius.5ch.net/test/read.cgi/tech/1723861080/155
156: デフォルトの名無しさん [sage] 2025/01/11(土) 15:07:44.39 ID:MN266Dik とうとう Windows の Best-Fit-Conversion が槍玉にあげられたか これって多数の個別アプリの問題に矮小化されてきたけどどう考えてもOSの設計ミスにしかみえない http://mevius.5ch.net/test/read.cgi/tech/1723861080/156
157: デフォルトの名無しさん [sage] 2025/01/11(土) 16:08:55.10 ID:IZON3iKr 件のBestFit機能のせいで、 windowsバッチでフルパスが半角スペースなし全角スペースありだと、 どのようにクォーティングをしようともまともに動かなくなったわけか http://mevius.5ch.net/test/read.cgi/tech/1723861080/157
158: デフォルトの名無しさん [sage] 2025/01/11(土) 16:17:43.05 ID:PjVvqmiz システム設定でUTF8にするとメモ帳でSJISテキストファイルが文字化けする訳だけど この特需で伸ばす代替エディタは何か? http://mevius.5ch.net/test/read.cgi/tech/1723861080/158
159: デフォルトの名無しさん [sage] 2025/01/11(土) 16:20:20.66 ID:PjVvqmiz 場合によっては情シスがSJISテキストファイルリストアップツールを用意する事になりそう http://mevius.5ch.net/test/read.cgi/tech/1723861080/159
160: デフォルトの名無しさん [sage] 2025/01/11(土) 16:29:41.49 ID:IZON3iKr UTF-8に設定すると、JaneStyleは今度こそ本当に使えなくなるんだよな http://mevius.5ch.net/test/read.cgi/tech/1723861080/160
161: デフォルトの名無しさん [sage] 2025/01/11(土) 16:37:08.97 ID:8GlegYBS ファイル名に禁則文字を増やしても避けられないのだろうか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/161
162: デフォルトの名無しさん [sage] 2025/01/11(土) 16:50:18.36 ID:SJ4Pziuh これを機に932以外では文字化けするレガシーアプリは駆逐されれば良い http://mevius.5ch.net/test/read.cgi/tech/1723861080/162
163: デフォルトの名無しさん [sage] 2025/01/11(土) 17:11:19.10 ID:MN266Dik >>161 ファイル名の禁則レベルでは無理 Unicode の一部の文字がバックスラッシュとか空白とかクォートとかの区切り文字や特殊処理する文字に化けるので、これを利用して入力を誤魔化せるという技 どう化けるかはコードページ次第 全部のアプリがユニコード対応になるか Windows が BestFit やめない限りは多くのアプリで同様の問題が量産される(オープンソース系のアプリはこれはOSの仕様のせいでアプリのバグじゃないので直すつもりはないとか言ってる) UTF-8だとBestFit使われないので Windows 12 とかで SJIS とか Win-1521 とか捨ててデフォルトが UTF-8 になれば解決するけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/163
164: デフォルトの名無しさん [sage] 2025/01/11(土) 17:17:54.37 ID:IZON3iKr システムをUTF-8に設定した上で、 CP932なアプリについて、個別のマニフェストの"activeCodePage"を"CP932"することで使えるようにならないんだろうか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/164
165: デフォルトの名無しさん [sage] 2025/01/11(土) 17:23:40.51 ID:MN266Dik >>164 今のところできないし、できたとしてもその cp932 に設定したプログラムで BestFit による抜け穴が使われるリスクがある http://mevius.5ch.net/test/read.cgi/tech/1723861080/165
166: デフォルトの名無しさん [sage] 2025/01/11(土) 17:41:24.43 ID:8GlegYBS ファイル名に英数字以外禁止したら何とかなりそうな気はした http://mevius.5ch.net/test/read.cgi/tech/1723861080/166
167: デフォルトの名無しさん [sage] 2025/01/11(土) 17:49:38.65 ID:MN266Dik >>166 ファイル名だけじゃないから コマンドのオプションスイッチとか、URL とか、環境変数とか、レジストリとか、とにかくプログラムの入力全部 http://mevius.5ch.net/test/read.cgi/tech/1723861080/167
168: デフォルトの名無しさん [sage] 2025/01/11(土) 22:53:43.82 ID:ftPdDy1W Windows全然詳しくないんだけど、Windows APIのANSI APIとUnicode APIとの違いって 標準Cライブラリの文字出力で言えばprintfとwprintfとの違いってことだよね? 世の中のOSSのほとんどはwprintf等のワイド文字関数なんて使っていないんだから OSSをWindowsで動かした場合ほぼ全部WorstFitの影響を受けることになるはず 今後基本的にワイド文字関数で書くべきってなると、Hello Worldは #include <stdio.h> #include <locale.h> #include <wchar.h> int main(int argc, char **argv) { setlocale(LC_ALL, ""); wprintf(L"こんにちは世界\n"); } こうすべきってこと? http://mevius.5ch.net/test/read.cgi/tech/1723861080/168
169: デフォルトの名無しさん [sage] 2025/01/11(土) 23:28:05.92 ID:ftPdDy1W あ、 int main(int argc, char **argv) エントリーポイントの時点で引数がワイド文字じゃないから脆弱性の影響を受ける可能性があるのか wmainがあるのはそういう理由なのね http://mevius.5ch.net/test/read.cgi/tech/1723861080/169
170: デフォルトの名無しさん [sage] 2025/01/12(日) 08:20:59.76 ID:xo4UH4ro MS的には「いまだにワイド文字列使ってないアプリが悪い」なんだよな http://mevius.5ch.net/test/read.cgi/tech/1723861080/170
171: デフォルトの名無しさん [sage] 2025/01/12(日) 11:43:06.44 ID:2Lg/ICMd >>170 最近は ANSI は UTF-8 に固定しろとか言い出してる http://mevius.5ch.net/test/read.cgi/tech/1723861080/171
172: デフォルトの名無しさん [sage] 2025/01/12(日) 12:45:56.54 ID:/g6mpPgl >>160 Jane大好きマウイ君がウォームアップしてそう ああ見えてフッ軽だから今度はflutterで作ったりしてなw http://mevius.5ch.net/test/read.cgi/tech/1723861080/172
173: デフォルトの名無しさん [] 2025/01/13(月) 13:47:41.46 ID:g4/CTboD UTF-8に一本化されるなら嬉しいな http://mevius.5ch.net/test/read.cgi/tech/1723861080/173
174: デフォルトの名無しさん [sage] 2025/01/13(月) 21:19:29.06 ID:5zeCvv1K Windows アプリで UTF-8 コード ページを使用する https://learn.microsoft.com/ja-jp/windows/apps/design/globalizing/use-utf8-code-page http://mevius.5ch.net/test/read.cgi/tech/1723861080/174
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 296 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.019s