文字コード総合スレ part15 (470レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
125: デフォルトの名無しさん [sage] 2024/12/06(金) 21:07:04.96 ID:PqgirqmV >>124 Mac はローカルファイルは NFD (っぽい独自仕様)で正規化されてる前提で、リモートのSMBの先は NFC (っぽい独自仕様)で正規化されている前提で動作するという謎仕様なので Lunux は基本的に正規化されずに全部別の文字扱いで unicode の全文字が使える Windows も基本的には正規化を前提にしていないが独自仕様の使えない文字がある http://mevius.5ch.net/test/read.cgi/tech/1723861080/125
126: デフォルトの名無しさん [sage] 2024/12/06(金) 21:22:50.16 ID:XSDLieo6 わかりやすいようにたとえで説明するとさ、 オマエんちに人を招待したら、土足のまま上がってきた オマエはイラっとするんじゃね? はいオマエ遅れてる〜 http://mevius.5ch.net/test/read.cgi/tech/1723861080/126
127: デフォルトの名無しさん [sage] 2024/12/06(金) 21:35:56.15 ID:PqgirqmV 服装カジュアルな場所でも常にスーツ着てきてスーツ着てないやつは家族だろうと友人だろうと全員無視するのが Mac 仕草 その上、自宅用と訪問用に別の種類のスーツを使い分けてて同じ種類のスーツ着てないと相手してくれない http://mevius.5ch.net/test/read.cgi/tech/1723861080/127
128: デフォルトの名無しさん [sage] 2024/12/07(土) 10:53:50.76 ID:+zec5U9G UnicodeはUnicodeで様々な言語の様々な表現ができるようにするなかで一意性についても 用途や目的によって方法は異なるとしているわけで、そもそもファイルをファイル名で特定するという 昔ながらのやり方との齟齬が出てきているのかもね。 使うなら使うでファイルシステムに用いる正規化ルールなどを定めなければならないんだろう。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/128
129: デフォルトの名無しさん [sage] 2024/12/07(土) 11:21:31.79 ID:RCmjilK5 同一性やコロケーション問題として path-win-ntfs、path-linux-ext4のようにunicodeでpath-localeを定めてicu実装されたら良いのにと思った事はあったけど、 それで他の方法が駆逐されるわけじゃなく新たなバリエーションを増やすだけだから、今は余計な事するなと思うよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/129
130: デフォルトの名無しさん [sage] 2024/12/07(土) 11:21:45.13 ID:prVW7qhX >>128 ファイル名はOS的には単なる識別子なのでバイト列一致で良い それを文字コードと絡めて正規化しようとするのがそもそもの間違い バイト列をどのように解釈するかは別のレイヤーの問題 http://mevius.5ch.net/test/read.cgi/tech/1723861080/130
131: デフォルトの名無しさん [sage] 2024/12/07(土) 11:44:07.08 ID:3wlpERVS FSとしてならそれでいい OSをどの層までとするかでも変わってくるけど マウント時に変換かけてOS間の相互運用気にしてほしい ネットワーク透過考えるとパスはURIで扱いたいしね http://mevius.5ch.net/test/read.cgi/tech/1723861080/131
132: デフォルトの名無しさん [sage] 2024/12/07(土) 13:08:36.00 ID:prVW7qhX >>131 基本的にはアプリ側のライブラリ層でやるべきこと OS標準ライブラリかユーザ追加ライブラリかはOSの思想によるし Linux とかだとOS標準ライブラリという考え方は縁遠いけど マウントの時にファイルシステムで文字コード変換するのも否定しないけど、あくまで代替手段なので、固定ではなくオプションや設定で利用者で任意に変更できるべきもの http://mevius.5ch.net/test/read.cgi/tech/1723861080/132
133: デフォルトの名無しさん [] 2024/12/07(土) 14:01:25.11 ID:8ekNK8XT >他の方法が駆逐されるわけじゃなく新たなバリエーションを増やすだけ ほんそれ http://mevius.5ch.net/test/read.cgi/tech/1723861080/133
134: デフォルトの名無しさん [sage] 2024/12/07(土) 14:17:40.72 ID:Zwl6oBBL まずはMacを駆逐しよう http://mevius.5ch.net/test/read.cgi/tech/1723861080/134
135: デフォルトの名無しさん [sage] 2024/12/07(土) 16:00:13.39 ID:2Ddhf3xH Mac で日本語を駆逐でいいんじゃね? http://mevius.5ch.net/test/read.cgi/tech/1723861080/135
136: デフォルトの名無しさん [sage] 2024/12/07(土) 21:42:37.76 ID:1sWZyE4C ファイル名にはASCIIにある文字しか使わないようにすれば解決 http://mevius.5ch.net/test/read.cgi/tech/1723861080/136
137: デフォルトの名無しさん [sage] 2024/12/07(土) 21:44:45.68 ID:prVW7qhX >>136 ASCII のバックスラッシュが円記号になってしまう OS がるらしい http://mevius.5ch.net/test/read.cgi/tech/1723861080/137
138: デフォルトの名無しさん [sage] 2024/12/08(日) 03:07:43.02 ID:h9KuPnHR >>136 じゃあまずはASCII以外でここに書き込むのやめろよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/138
139: デフォルトの名無しさん [sage] 2024/12/08(日) 04:05:29.89 ID:Xxla/ZnP >>138 ここにファイル名を書いてる人あまりいないと思うんだけど? http://mevius.5ch.net/test/read.cgi/tech/1723861080/139
140: デフォルトの名無しさん [] 2024/12/09(月) 11:25:01.55 ID:uh4vUAM3 波ダッシュ(〜)と全角チルダ(〜)は違う文字 http://mevius.5ch.net/test/read.cgi/tech/1723861080/140
141: デフォルトの名無しさん [sage] 2024/12/09(月) 12:17:56.89 ID:Ne3E3UJU JISで全角チルダ定義したのがアレだよな 全角しか表示できない場面のためだろうけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/141
142: デフォルトの名無しさん [sage] 2024/12/09(月) 14:00:31.58 ID:4HU/GnaT >>141 JIS は全角と半角とか定義してない(定期 http://mevius.5ch.net/test/read.cgi/tech/1723861080/142
143: デフォルトの名無しさん [sage] 2024/12/09(月) 14:37:46.18 ID:+G8yezOA >>142 えー、をMSIMEで変換したら 全角チルダ(U+FF5E)でした 抑揚のある伸ばし棒はこれが正解ですか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/143
144: デフォルトの名無しさん [sage] 2024/12/09(月) 15:02:44.75 ID:4HU/GnaT >>143 知らん MS が決めたことは MS に聞け 全角とか半角とか関係ない http://mevius.5ch.net/test/read.cgi/tech/1723861080/144
145: デフォルトの名無しさん [sage] 2024/12/09(月) 17:46:32.24 ID:bX1qj24S この板には表層的にMSを持ち出すだけで思考停止する若干一名がいるね http://mevius.5ch.net/test/read.cgi/tech/1723861080/145
146: デフォルトの名無しさん [sage] 2024/12/09(月) 18:34:12.95 ID:4HU/GnaT >>145 シフトJISの「波ダーシ」を unicode の「全角チルダ」にマッピングする CP932 を規定したのはマイクロソフト マイクロソフト以外の Linux とか MacOS とかその他の各社OSではそうなっていない マイクロソフトが何でこんなマッピングにしたのかは専門家でも分かんない謎 unicode がまだドラフトの時代にあわてて作業したのでミスっただけの可能性も指摘されてるが、一度決めたものは互換性のために変えられないのだろう点は理解できる http://mevius.5ch.net/test/read.cgi/tech/1723861080/146
147: デフォルトの名無しさん [sage] 2024/12/09(月) 23:51:59.27 ID:TvtcjS7H マイクロソフト憎しにも程がある デマだめ絶対 http://mevius.5ch.net/test/read.cgi/tech/1723861080/147
148: デフォルトの名無しさん [sage] 2024/12/13(金) 01:50:01.54 ID:XDI5kMlm マイクロソフトの場合親の敵の可能性があるから俺は許すね 気の済むまでじゃんじゃんやっといてくれ http://mevius.5ch.net/test/read.cgi/tech/1723861080/148
149: デフォルトの名無しさん [sage] 2024/12/13(金) 02:14:20.18 ID:OiDxg/7M unicode 規格が最初に作られた時サイトに参考情報として JIS と unicode のマッピング表が置いてあった Linux も Mac も商用Unixもこの表に従ってJISの波ダーシを unicode の wave dash にマッピングした。さらに JISの規格書にもこのマッピングで記載された ただ Microsoft 1社だけは JIS の波ダーシを unicode の fullwidth tilde にマッピングした こんなんマイクロソフトの中の人以外に理由が分かるわけねーだろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/149
150: デフォルトの名無しさん [sage] 2024/12/13(金) 11:09:50.07 ID:ncXjn+FF 初期のUnicode仕様書の文字の形がおかしかったのがそもそもの原因なんだけどね いまの仕様書では、〜(U+301C、波ダッシュ)は、~(U+FF5E、全角チルダ)と同じ字形だけど、 古いものは、上下反転した存在しない文字の形だったので、どちらに合わせるかを決める時点で、 MSは形の相似した全角チルダのU+FF5Eを、その他は仕様どおりの波ダッシュのU+301Cを割り当てた 更にMacは仕様書を無視して字形を変更し、現在の仕様書と同じようにU+301Cに本来の波ダッシュの形を割り当てた ただ、上下反転した字形は、縦書きの際の全角チルダ(左右の順)文字を横書きにしたために紛れ込んだとも言われているので、 仕様書制定の段階で縦書きのある日本語を理解した人が加わっていなかったのだろうな まぁ、仕様書の字形がおかしかったことがそもそもの原因ではあるけれど、 これの対応を話し合いをすることなく各社で独自に行なってしまったというのが一番大きいな 結局、日本語が軽んじられていたんだろうけど、なんとも間抜けな話 http://mevius.5ch.net/test/read.cgi/tech/1723861080/150
151: デフォルトの名無しさん [sage] 2024/12/13(金) 11:39:54.50 ID:OiDxg/7M >>150 仕様書も文字の形がおかしかったはネットの素人が勝手に推測した迷信、文字形は規定していない 文字コード的にはフォントで変わる文字の形は意味がない unicode の wave dash は JIS 第一水準の波ダージなどに対応する文字として準備された unicode の互換領域の fullwidth tilde は EUC-JP とかで使用されいたJIS補助漢字のチルダをマッピングするために準備された EUC-JP では ASCII の1バイト文字のチルダと補助漢字の2倍と文字のチルダに両方が使われていたので互換領域が必要だった http://mevius.5ch.net/test/read.cgi/tech/1723861080/151
152: デフォルトの名無しさん [sage] 2025/01/11(土) 13:26:51.55 ID:ftPdDy1W なんか文字コード絡みでWindowsに特大級のセキュリティホールが見つかったぽい https://blog.orange.tw/posts/2025-01-worstfit-unveiling-hidden-transformers-in-windows-ansi/ http://mevius.5ch.net/test/read.cgi/tech/1723861080/152
153: デフォルトの名無しさん [] 2025/01/11(土) 13:36:00.86 ID:ftPdDy1W CP65001で緩和可能ってことであってるよね? 超ヤバげなんでageるよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/153
154: デフォルトの名無しさん [sage] 2025/01/11(土) 13:52:24.87 ID:wkEhpAnW >>153 あってる MSYS2を使ってれば2,3ヶ月前には対策の副作用があったから知ってたよ メディアはもっとこれを大きく報じてユーザー環境にもUTF8ロケールが広まって欲しい http://mevius.5ch.net/test/read.cgi/tech/1723861080/154
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 316 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.010s