文字コード総合スレ part15 (472レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
241: デフォルトの名無しさん [sage] 2025/01/25(土) 06:47:37.99 ID:IEhZAzOs >>240 なんでもOSのせいにするのは良くないぞ Windows は片サロゲートどうしを連結することを前提にしてはいない あくまでも連結してるのはアプリの問題 WTF-8 の連結もアプリの問題OSとは独立 http://mevius.5ch.net/test/read.cgi/tech/1723861080/241
242: デフォルトの名無しさん [sage] 2025/01/25(土) 07:40:49.86 ID:oQSzfWfA >>241 もちろんその通りで 当たり前の三つの同値 WTF-8で起こりうること = WTF-16で起こりうること = Windowsで起こりうること これだけの話だな それを理解できずにWTF-8で新たな問題が生じると勘違いしているバカがWTF-8を批判していた http://mevius.5ch.net/test/read.cgi/tech/1723861080/242
243: デフォルトの名無しさん [sage] 2025/01/25(土) 08:02:54.69 ID:IEhZAzOs >>242 いや WTF-8 で起こりうること = WTF-16 で起こりうることは定義上正しいけど = Windows で起こりうること、は正しくないだろという指摘だぞ http://mevius.5ch.net/test/read.cgi/tech/1723861080/243
244: デフォルトの名無しさん [sage] 2025/01/25(土) 08:11:11.01 ID:oQSzfWfA >>243 意図的にUTF-16から逸脱したコードを生成するアプリ次第でWindows上で起こりうるから全く同じ もし違うというならばその差分となる具体例を出してください http://mevius.5ch.net/test/read.cgi/tech/1723861080/244
245: デフォルトの名無しさん [sage] 2025/01/25(土) 11:54:33.53 ID:IEhZAzOs >>244 Linux とかでも意図的に逸脱したコード書けば起きるだろ 違うってなんら Windows 固有にコード示したら? http://mevius.5ch.net/test/read.cgi/tech/1723861080/245
246: デフォルトの名無しさん [sage] 2025/01/25(土) 12:08:02.89 ID:oQSzfWfA >>245 それも正しい WindowsもLinuxも正しいユニコード以外を許容している だからUTF-16やUTF-8を前提としてはいけない そのためWTF-16やWTF-8あるいは何らか他の枠組みの導入でようやく対応できる その時に当たり前の三つの同値 WTF-8で起こりうること = WTF-16で起こりうること = Windowsで起こりうること この事実を理解できるかどうか これを理解できずにWTF-8で新たな問題が生じると勘違いしているバカがWTF-8を批判していた http://mevius.5ch.net/test/read.cgi/tech/1723861080/246
247: デフォルトの名無しさん [sage] 2025/01/25(土) 12:36:14.63 ID:IEhZAzOs >>246 = Windows で起こりうることに拘るのは何でだ? UTF-8 と WTF-8 は別物なのに同じように扱ったら問題が起きる可能性がある OS とは独立 http://mevius.5ch.net/test/read.cgi/tech/1723861080/247
248: デフォルトの名無しさん [sage] 2025/01/25(土) 13:00:31.67 ID:oQSzfWfA >>247 どのOSも正しいユニコード以外を許容している したがってUTF-8/16以外も扱えなければならない そして非UTF-8/16があった時にそれを認識して区別して扱えなければならない その区別ができないと既存のUTF-8/16部分にもうっかり混入させて汚染を広げてしまう この重要性が理解できるかね? RustではUTF-8とWTF-8(など非ユニコード)は明確に別の型となっているため安全性が保証される 両者を扱えつつ型システムにより必ず区別できる http://mevius.5ch.net/test/read.cgi/tech/1723861080/248
249: デフォルトの名無しさん [sage] 2025/01/25(土) 13:07:40.11 ID:IEhZAzOs >>248 だからOSとは独立の文字コードの扱いの問題 もっといえば文字コードを正しく扱えないアプリの問題 OSのせいにするな http://mevius.5ch.net/test/read.cgi/tech/1723861080/249
250: デフォルトの名無しさん [sage] 2025/01/25(土) 13:31:18.17 ID:oQSzfWfA >>249 どちらのOSも自由を許容している そのため非ユニコードが混入しうる OSは歯止めにならない だからRustのように型で明確に区別できる言語を用いてアプリを作ればよい 非ユニコードが他へ波及することを防ぎつつ安全に扱うことができる http://mevius.5ch.net/test/read.cgi/tech/1723861080/250
251: デフォルトの名無しさん [sage] 2025/01/25(土) 14:44:40.60 ID:6/VZHgMn from_encoded_bytes_uncheckedにoverlong UTF-8をブチ込んでinto_stringしたらOk返ってきちゃった StringまたはWTF-16から変換されること以外は無い前提でチェックは最低限にされてるみたい unsafe contractを破った俺が悪いのはそうなんだが、これを「WTF-8文字列コンテナ型」だと思ってたらまあまあ死にそう バイト列からの変換にcheckedな版が無いのも、一応エンコーディング未規定なんだから好き勝手なバイト列から作るもんじゃねーよバーカってことだな 同じことをLinuxでもやったらこっちはinto_stringの時点でErrが返ってくる OsStringの内部のバッファの不変条件としても違いがあって、Windows以外では任意のバイト列でいいけど、Windowsでは常にWTF-8でなくてはならないようだ WTF-8それ自体が脆弱性の根源になることはなくても、こうしたややこしさが誤った使い方、ひいては脆弱性を生むことはあるかもしれないとは思った http://mevius.5ch.net/test/read.cgi/tech/1723861080/251
252: デフォルトの名無しさん [sage] 2025/01/25(土) 15:20:14.12 ID:0Kd0a2wN >>251 そのunsafe fn from_encoded_bytes_unchecked(byres: Vec<u8>)は安全性の対象外と明示されているね unsafeとはC言語と同じようにプログラマーの責任で安全性を保証しなければならない それを理解しない者や扱う技術を持たない者がunsafeを使ってはいけない それ以前にRustは今回の件も自動的に安全性が保証されるコードを(unsafeを使わずに)書くことができる http://mevius.5ch.net/test/read.cgi/tech/1723861080/252
253: デフォルトの名無しさん [sage] 2025/01/25(土) 15:40:07.61 ID:6/VZHgMn >>252 その通り、だからunsafe contractを破った俺が悪いと書いた しかしぶっ壊すことで得られる学びは多い http://mevius.5ch.net/test/read.cgi/tech/1723861080/253
254: デフォルトの名無しさん [sage] 2025/01/25(土) 15:45:28.44 ID:6/VZHgMn というかもうWTF-8の話じゃなくてRustの話になりつつあるしこの辺で終わっとこうぜ 続きがやりたければRust本スレで http://mevius.5ch.net/test/read.cgi/tech/1723861080/254
255: デフォルトの名無しさん [sage] 2025/01/25(土) 21:10:55.94 ID:yCgioYGI Rustスレから出てこないで欲しい http://mevius.5ch.net/test/read.cgi/tech/1723861080/255
256: デフォルトの名無しさん [sage] 2025/01/25(土) 22:20:25.13 ID:LC7IJQQw 構うから居座り続けるんだよ 学習しろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/256
257: デフォルトの名無しさん [sage] 2025/01/26(日) 10:07:42.23 ID:QXh9thRU Macの濁点半濁点問題ってUTF-8の正規化とやらの範疇に入るのかな 文字構成の解釈の仕方の問題だから正規化を実装する人の思想に強く依存してしまうと思うけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/257
258: デフォルトの名無しさん [sage] 2025/01/26(日) 10:56:58.06 ID:14aIx6OH 日本人からすると濁点半濁点の違うMacうぜーとなるけど 欧州でもdiacriticsがあるから同じくMacうぜーだろうな http://mevius.5ch.net/test/read.cgi/tech/1723861080/258
259: デフォルトの名無しさん [sage] 2025/01/26(日) 11:31:33.02 ID:orn1Lem+ >>257 このスレにいるなら文字コードとエンコーディングの区別を理解しよう UTF-8はエンコーディング方法なので そこでの正規化は冗長表現の排除やサロゲートペアの排除を指す 一方濁点半濁点の話は文字コードであるUnicodeの正規化の話であってUTF-8は一切関係がない http://mevius.5ch.net/test/read.cgi/tech/1723861080/259
260: デフォルトの名無しさん [sage] 2025/01/26(日) 11:52:28.72 ID:OHuPDl3g >>257 Unicode の正規化は規格で決まっている 基本的に実装者の自由にやってはいけない ・複数の正規化が規定されてるのでそのうちの1つに過ぎない ・MacOSの正規化は一部規格から外れてる という問題はある http://mevius.5ch.net/test/read.cgi/tech/1723861080/260
261: デフォルトの名無しさん [sage] 2025/01/26(日) 12:03:07.52 ID:Lrs5O7+s Macの濁点半濁点問題はEBCDICのカナ(半角カタカナ)をきれいに表示する努力をした結果なのだろうか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/261
262: デフォルトの名無しさん [sage] 2025/01/27(月) 11:38:12.00 ID:ss2Vvpwv ファイル名は正規化するべきなのかするべきでないのか、という問題があり Macは正規化する派 正規化するとした場合、どういう正規化がいいか、それが次の問題 http://mevius.5ch.net/test/read.cgi/tech/1723861080/262
263: デフォルトの名無しさん [] 2025/01/27(月) 18:51:09.07 ID:5zVfH4ct 日本語のフォントを外国人が作っているせいで日本語の記号の見た目がおかしくなった http://mevius.5ch.net/test/read.cgi/tech/1723861080/263
264: デフォルトの名無しさん [] 2025/01/27(月) 18:52:15.56 ID:5zVfH4ct >>262 Macのアップル社もGoogle社も改行コードに対しては意地悪すぎだろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/264
265: デフォルトの名無しさん [sage] 2025/01/27(月) 22:05:41.27 ID:1OoDt+VN Apple の改行コードはCRだったものがMac OS X でLFになったのを意地悪と言っているのだろうか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/265
266: デフォルトの名無しさん [] 2025/01/27(月) 23:31:59.65 ID:5zVfH4ct >>265 WindowsのCRLFをどちらも改行と見做すところ どう考えても1つの改行なのにEメールなどでは2つの改行として送り返してくる http://mevius.5ch.net/test/read.cgi/tech/1723861080/266
267: デフォルトの名無しさん [] 2025/01/28(火) 10:08:29.84 ID:dqvH8r5C CR=改行(Macのみ) CRLF=改行(WindowsやRFC) LF=改行(Unix) >>266 それはアプリのバグ http://mevius.5ch.net/test/read.cgi/tech/1723861080/267
268: デフォルトの名無しさん [sage] 2025/01/28(火) 11:39:24.54 ID:JQ2UpNE9 >>267 いろいろ間違えてるぞ 正確さが足りない http://mevius.5ch.net/test/read.cgi/tech/1723861080/268
269: デフォルトの名無しさん [] 2025/01/30(木) 07:10:47.96 ID:gms+ATb5 ワシの霊感では、 CR LF → LF 変換 は無理 CR LF → CR 変換 も無理 その逆、は可能、スナワチ LF → CR LF 変換等は、可能 なんでかって❓ 霊感的には、 それが可能と仮定すれば、そのような問題は解決済 しかし未だに未解決の模様なので、 では、霊感的にではなく、数学的にはどうなのか 吟味しようかな。てか不可能が証明されても その証明は、闇に葬る必要があるよな by 💃🥳🤔 とにかく、アプリの改行バグなくせぇーー by 👤🤡 http://mevius.5ch.net/test/read.cgi/tech/1723861080/269
270: デフォルトの名無しさん [sage] 2025/01/30(木) 10:13:34.95 ID:lxoi8Hgj RFCもいまどき入力は寛容にとは書いてないんだっけか http://mevius.5ch.net/test/read.cgi/tech/1723861080/270
271: デフォルトの名無しさん [sage] 2025/01/30(木) 23:31:56.82 ID:xDtExgvT 改行の話をするならこのTRには目を通しているよね? https://www.unicode.org/reports/tr14/tr14-32.html#BreakingRules http://mevius.5ch.net/test/read.cgi/tech/1723861080/271
272: デフォルトの名無しさん [] 2025/01/31(金) 19:55:09.44 ID:0CYGlf8F CRの直後にLFが現れたなら、改行2つではないとわかる。 それなのに改行2つと解釈するのは悪意でしかないり http://mevius.5ch.net/test/read.cgi/tech/1723861080/272
273: デフォルトの名無しさん [sage] 2025/01/31(金) 20:06:45.58 ID:RSTFpkS7 CR や LF より前に CRLF を処理しないのは悪意でしか無いな http://mevius.5ch.net/test/read.cgi/tech/1723861080/273
274: デフォルトの名無しさん [sage] 2025/01/31(金) 20:07:21.09 ID:B141IEhK >>260 NFD、NFC等を名乗るならそうだが最初からmodified NFD言ってるしなあ 当時は異体字セレクタなどなく、ただのNFDで字形まで変えるUnicodeの定義のほうがおかしかった http://mevius.5ch.net/test/read.cgi/tech/1723861080/274
275: デフォルトの名無しさん [sage] 2025/01/31(金) 20:25:32.29 ID:uF0JLDg9 >>274 みんながみんな勝手に modified NFD とか作り始めたら互換性とか規格とか何の意味もなくなる 勝手なオレオレ基準は非難されるべき 単に古い規格準拠というだけなら許されるが Apple のはそうじゃない http://mevius.5ch.net/test/read.cgi/tech/1723861080/275
276: デフォルトの名無しさん [sage] 2025/01/31(金) 20:45:51.19 ID:B141IEhK そもそも正規化自体は都合に合わせて勝手にやるもんだぜ? Windowsの.で終わるファイル名を拡張子なしと同一視するのも正規化だし 掲示板への書き込みで行頭のスペースが消えるのも正規化だ Unicodeで定義されたやつだけが正規化ではないというのは大前提として 字形を変えない範囲で厄介な合成分解で別ファイル扱いになるのを避けたい というのは他の文字コードからUnicodeへの過渡期では当然の要求だろう 他のOSとのやりとりでトラブルが起きるようになったのはもっと考えるべきだったとは思うが http://mevius.5ch.net/test/read.cgi/tech/1723861080/276
277: デフォルトの名無しさん [sage] 2025/01/31(金) 20:53:12.36 ID:uF0JLDg9 >>276 それは違う Apple はユニコード・コンソーシアムの設立からのメンバー 技術的に規格に問題があるののならそれを変えればいい、それをやらなければいけない立場 中核メンバーが自分たちが作った規格を勝手に無視してたら、規格の意味なんてない この件はどう言い訳しても Apple はクソという結論にしかならない http://mevius.5ch.net/test/read.cgi/tech/1723861080/277
278: デフォルトの名無しさん [sage] 2025/01/31(金) 20:55:58.32 ID:B141IEhK >>277 Appleは提案したが通らなかったってどっかで見たぞ http://mevius.5ch.net/test/read.cgi/tech/1723861080/278
279: デフォルトの名無しさん [sage] 2025/01/31(金) 20:57:03.60 ID:h9+hJoTP 技術的に無理な仕様作ったん? http://mevius.5ch.net/test/read.cgi/tech/1723861080/279
280: デフォルトの名無しさん [sage] 2025/01/31(金) 21:06:00.74 ID:uF0JLDg9 >>278 どこで見たんだ? 技術的に変な提案したら通らないだろうが、それが規格を無視して良い理由にはならない それを理由に脱退したんなら一理あるけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/280
281: デフォルトの名無しさん [sage] 2025/01/31(金) 21:19:51.37 ID:1pwkweKb 規格があるのにそれを使わない分野なんて沢山ありそうだが 実際のところ金を出せて声がでかければ規格なんていくらでも通せるんだから http://mevius.5ch.net/test/read.cgi/tech/1723861080/281
282: デフォルトの名無しさん [sage] 2025/01/31(金) 21:24:04.22 ID:B141IEhK >>280 俺が見た記事は残ってないだろうけど検索したら出てきたunicode.org内の議事録はたぶんこれ ttps://www.unicode.org/review/resolved-pri.html#pri7 http://mevius.5ch.net/test/read.cgi/tech/1723861080/282
283: デフォルトの名無しさん [sage] 2025/01/31(金) 21:26:16.69 ID:gGXkx70A >>281 ヒデェ http://mevius.5ch.net/test/read.cgi/tech/1723861080/283
284: デフォルトの名無しさん [sage] 2025/01/31(金) 22:22:23.03 ID:mygoMuj6 >>282 www 一部除外したら一貫性が無くなって正規化が 正規化じゃなくなるから勝手な除外は駄目って明確に指摘されてるな なんで実装したんだろう? いやVFとか使いたくなかったんだろうけど、 どうしてもやりたければ任意の除外ではなく VF のみ除外みたいなので再提案すべきだったのでは http://mevius.5ch.net/test/read.cgi/tech/1723861080/284
285: デフォルトの名無しさん [sage] 2025/02/16(日) 22:21:14.00 ID:y/0wzlVz https://gigazine.net/news/20250214-unicode-hidden-message/ Unicodeでは一見すると普通の文字の中に「秘密のメッセージ」を埋め込むことが可能だという指摘 http://mevius.5ch.net/test/read.cgi/tech/1723861080/285
286: デフォルトの名無しさん [sage] 2025/02/16(日) 23:51:54.49 ID:hLnUvUfF >>285 なるほどね https://i.gzn.jp/img/2025/02/14/unicode-hidden-message/03.png http://mevius.5ch.net/test/read.cgi/tech/1723861080/286
287: デフォルトの名無しさん [sage] 2025/02/17(月) 16:59:47.72 ID:GjzIkJ/e Unicodeはそのうちオーディオブック用やa11yで読み上げ音声用のVSが定義されそう http://mevius.5ch.net/test/read.cgi/tech/1723861080/287
288: デフォルトの名無しさん [sage] 2025/02/17(月) 17:34:45.48 ID:9sDD+e7d 漢字みたいな複数の読み方があるのは難しいだろうね http://mevius.5ch.net/test/read.cgi/tech/1723861080/288
289: デフォルトの名無しさん [sage] 2025/02/17(月) 18:36:11.68 ID:tdbxV0fJ MSOfiiceでIME入力がphoneticsとして保存されてて読み仮名表示出来るのは、他に広まっても良いのにな http://mevius.5ch.net/test/read.cgi/tech/1723861080/289
290: デフォルトの名無しさん [sage] 2025/02/18(火) 12:25:03.72 ID:HbHlBTpR >>286 なるほどね fn byte_to_variation_selector(byte: u8) -> char { if byte < 16 { char::from_u32(0xFE00 + byte as u32).unwrap() } else { char::from_u32(0xE0110 + (byte - 16) as u32).unwrap() } } http://mevius.5ch.net/test/read.cgi/tech/1723861080/290
291: デフォルトの名無しさん [] 2025/02/28(金) 17:04:23.70 ID:kF3VgEHE fn byte_to_variation_selector(byte: u8) -> Option<char> { if byte < 16 { char::from_u32(0xFE00 + byte as u32) } else { char::from_u32(0xE0110 + (byte - 16) as u32) } } http://mevius.5ch.net/test/read.cgi/tech/1723861080/291
292: デフォルトの名無しさん [sage] 2025/04/03(木) 21:05:53.03 ID:tEk54HNS 「Windows11でファイル名に絵文字が使えることを知って、1つ賢くなった」便利と思われる機能が追加→情シスがバールを担いで暴れ出す案件 https://posfie.com/@blackstaragent/p/kpHrLMR 今まで使えなかったんだっけ?と思って最後まで見たら ちゃんと前から使えてたって突っ込まれてたわ http://mevius.5ch.net/test/read.cgi/tech/1723861080/292
293: デフォルトの名無しさん [sage] 2025/04/06(日) 16:37:54.44 ID:+flcOJuk 普通に文を書く時でも()?!などの記号をASCII文字にするか全角文字にするか 濁点と半濁点を結合済み文字にするか別の文字にするかで迷ってしまう http://mevius.5ch.net/test/read.cgi/tech/1723861080/293
294: デフォルトの名無しさん [] 2025/04/07(月) 21:43:17.60 ID:1UVr/FZP 濁点と半濁点が別の文字だと認識しているのはおかしい http://mevius.5ch.net/test/read.cgi/tech/1723861080/294
295: デフォルトの名無しさん [] 2025/04/08(火) 17:04:31.43 ID:UfxEZoR8 まし"て" http://mevius.5ch.net/test/read.cgi/tech/1723861080/295
296: デフォルトの名無しさん [] 2025/04/09(水) 01:54:47.78 ID:t8BwIxsD Windowsのエクスプローラーで見るとキャラクタセットによっては濁点が別の文字だとわからないことがある http://mevius.5ch.net/test/read.cgi/tech/1723861080/296
297: デフォルトの名無しさん [sage] 2025/04/11(金) 20:08:58.20 ID:i2PY9ZNn 朝鮮系の奴隷労働者が造ったと思われるサイトは 濁点が抜けてる気持ち悪いところがいくつかある http://mevius.5ch.net/test/read.cgi/tech/1723861080/297
298: デフォルトの名無しさん [sage] 2025/04/12(土) 06:35:11.93 ID:IMDrBc8a 調整 https://techracho.bpsinc.jp/hachi8833/2021_09_08/48435 https://gigazine.net/news/20231005-unicode/ 477414164X http://mevius.5ch.net/test/read.cgi/tech/1723861080/298
299: デフォルトの名無しさん [] 2025/05/02(金) 09:50:51.92 ID:k5bGwZZ0 不可視化トラップで教育素材造るのはいいね https://www.youtube.com/watch?v=cXTBwD798Lk http://mevius.5ch.net/test/read.cgi/tech/1723861080/299
300: デフォルトの名無しさん [sage] 2025/05/02(金) 18:10:04.97 ID:9xoZUliT ユニコード悪用ヤバいな >>298 >公式アプリと同じ開発者に見える名前で偽アプリが提供されました。 >この詐欺師は、印刷に現れないスペース文字を開発者名に混ぜ込むことでバリデーションのすり抜けに成功しました。 >このハックによって100万人以上が騙されました。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/300
301: デフォルトの名無しさん [] 2025/05/02(金) 20:30:48.79 ID:rPO248eK >印刷に現れないスペース文字 誤訳だな AIあほすぎ http://mevius.5ch.net/test/read.cgi/tech/1723861080/301
302: デフォルトの名無しさん [sage] 2025/05/07(水) 21:40:30.18 ID:9JkcRkxN https://github.com/microsoft/cascadia-code/releases/tag/cascadia-next Joyo, JIS1, JIS2って何だよ 日本人向けのフォントなら日本人に分かるような書き方してくれ http://mevius.5ch.net/test/read.cgi/tech/1723861080/302
303: デフォルトの名無しさん [] 2025/05/08(木) 02:26:11.93 ID:US+UAC1U >>258 多分Mac OS Xのファイル名にNFDを採用したのは 辞書順がdiacriticsを無視する言語文化圏の人だったのでは 欧州では多数派だけど唯一ではない >>121 OS kernelのsyscall部分で矯正してるわけではなくて file system driverがやってる(ただしDarwinソースを確認したのは10年以上前) だからUSBメモリだとかNFSだと、NFCでも書ける ただし他の人も書いてる通りライブラリでも強制してる CLIだと関係ない http://mevius.5ch.net/test/read.cgi/tech/1723861080/303
304: デフォルトの名無しさん [] 2025/05/08(木) 03:01:55.71 ID:US+UAC1U ちなみにライブラリで必ずやることに変えれば 規格準拠にしやすいと思う フル準拠にするとカーネルに入れるにはテーブルが大きすぎる けどじゃあPython処理系はどうするんだ osモジュールに担当させるのか osモジュールみたいな機構がない言語処理系ではどうするんだ とか色々大変 http://mevius.5ch.net/test/read.cgi/tech/1723861080/304
305: デフォルトの名無しさん [] 2025/05/08(木) 03:15:04.31 ID:US+UAC1U 要するにパス名正規化は無意味で無駄 http://mevius.5ch.net/test/read.cgi/tech/1723861080/305
306: デフォルトの名無しさん [sage] 2025/05/08(木) 12:28:18.82 ID:of3Q4Bd7 ちっぱいでもいいじゃん http://mevius.5ch.net/test/read.cgi/tech/1723861080/306
307: デフォルトの名無しさん [sage] 2025/05/08(木) 16:10:03.97 ID:n8dUtc6U >>305 いや正規化やっても良いんだよ ただしやるなら規格書どおりにやれ 勝手仕様でやられると対応に困る http://mevius.5ch.net/test/read.cgi/tech/1723861080/307
308: デフォルトの名無しさん [sage] 2025/05/08(木) 23:33:49.27 ID:pZAMgdYa 規格には則ってる 複数あって非互換なのが問題 http://mevius.5ch.net/test/read.cgi/tech/1723861080/308
309: デフォルトの名無しさん [sage] 2025/05/08(木) 23:40:58.88 ID:n8dUtc6U >>308 MacOS のやつは規格にあってないんだよ しったかすんな http://mevius.5ch.net/test/read.cgi/tech/1723861080/309
310: デフォルトの名無しさん [] 2025/05/08(木) 23:51:00.29 ID:US+UAC1U せめてNFCにしてればな 殆どの文書はNFCで構成されるんだから それでもUnicodeは規格がバージョンごとに違うからなあ 正規化が無駄な努力 http://mevius.5ch.net/test/read.cgi/tech/1723861080/310
311: デフォルトの名無しさん [sage] 2025/05/09(金) 02:29:43.44 ID:3ts3cFTs >>303 ファイルコピーとかするときは毎回、正規化の変換が発生する感じ? (不明な正規化)->(特定の正規化) ってのは問題ないんだっけ? 一方でファイルビューア(Finder)とか上の方はどのFS上にいるとか意識 したくないだろうからなあ。そこでも正規化の変換が起こるのかな? http://mevius.5ch.net/test/read.cgi/tech/1723861080/311
312: デフォルトの名無しさん [] 2025/05/09(金) 11:12:25.67 ID:oh4Slinf ファイルビューア ↓正規化 ファイルヒ゛ューア こんなのやだな http://mevius.5ch.net/test/read.cgi/tech/1723861080/312
313: デフォルトの名無しさん [sage] 2025/05/09(金) 12:07:16.82 ID:OoJ+JMZS EBCDICカナ文字の話みたい。 ごめんなさい、ごめんなさい、ごめんなさい。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/313
314: デフォルトの名無しさん [] 2025/05/09(金) 15:56:58.76 ID:yePfNbNe >>311 最近macOSは余り触ってないが昔は (様々な理由により以下の状況が起きて) ファイルビューア ファイルヒ゛ューア の両方がディレクトリにある場合に、Finder.appでは ファイルビューア ファイルビューア と表示され後者しかアクセス出来なかった Cocoaが正規化してユーザやカーネルに渡すから http://mevius.5ch.net/test/read.cgi/tech/1723861080/314
315: デフォルトの名無しさん [] 2025/05/13(火) 18:18:02.49 ID:El9a77up 字にはヒラギノール http://mevius.5ch.net/test/read.cgi/tech/1723861080/315
316: デフォルトの名無しさん [sage] 2025/07/20(日) 21:42:09.27 ID:v9zpB8iu Microsoft Print to PDFで出力したファイルからテキストをコピペしたら文字化けしてた…→実はPDFの仕様に潜む本質的な欠陥が原因なのでは? https://togetter.com/li/2577928 http://mevius.5ch.net/test/read.cgi/tech/1723861080/316
317: デフォルトの名無しさん [sage] 2025/07/20(日) 22:29:37.55 ID:0FYiUEbf >>316 文字コードの問題ではなく単なるバグ より正確にいうと大昔からある PDF のフォントの使い方の問題 PDF はウェブと違って文字コードをデフォルトでは埋め込んでなくてフォント内の番号で直接埋め込んでる フィント番号と文字コードが1対1でマップしている保証はないのに、コピペの時はフォントに埋め込みの変換表で番号から文字コード生成する仕組になってる 複数の文字コードに同じフォントを割り当てているフォントを使うとこの問題が起きる http://mevius.5ch.net/test/read.cgi/tech/1723861080/317
318: デフォルトの名無しさん [sage] 2025/07/22(火) 01:09:42.93 ID:g3Tn7WHZ >>316 みたいな奴が参政党に投票する http://mevius.5ch.net/test/read.cgi/tech/1723861080/318
319: デフォルトの名無しさん [sage] 2025/07/22(火) 12:00:50.20 ID:Yl+nv6VH アドビはタイプセッター屋じゃけぇ、フォントファーストじゃけぇ http://mevius.5ch.net/test/read.cgi/tech/1723861080/319
320: デフォルトの名無しさん [sage] 2025/07/22(火) 12:55:59.74 ID:nZDCfJLI >>317 しかし1:1になるように、 つまり同じ字形が複数の文字コードで使われるなら、同じ字形のフォントを別登録してしまえば回避出来るのでは? ならPDF出力ソフトが糞なだけ http://mevius.5ch.net/test/read.cgi/tech/1723861080/320
321: デフォルトの名無しさん [sage] 2025/07/22(火) 13:37:16.00 ID:bKhKMrtD >>320 そんなことしたらサイズが無駄にでかくなるだろ PDFがアホなのは同意だが、unicode普及以前の技術なのを思い出せ http://mevius.5ch.net/test/read.cgi/tech/1723861080/321
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 151 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.012s