文字コード総合スレ part15 (470レス)
1-

290: 02/18(火)12:25 ID:HbHlBTpR(1) AAS
>>286
なるほどね
fn byte_to_variation_selector(byte: u8) -> char {
if byte < 16 {
char::from_u32(0xFE00 + byte as u32).unwrap()
} else {
char::from_u32(0xE0110 + (byte - 16) as u32).unwrap()
}
}
291: 02/28(金)17:04 ID:kF3VgEHE(1) AAS
fn byte_to_variation_selector(byte: u8) -> Option<char> {
if byte < 16 {
char::from_u32(0xFE00 + byte as u32)
} else {
char::from_u32(0xE0110 + (byte - 16) as u32)
}
}
292: 04/03(木)21:05 ID:tEk54HNS(1) AAS
「Windows11でファイル名に絵文字が使えることを知って、1つ賢くなった」便利と思われる機能が追加→情シスがバールを担いで暴れ出す案件
外部リンク:posfie.com

今まで使えなかったんだっけ?と思って最後まで見たら
ちゃんと前から使えてたって突っ込まれてたわ
293: 04/06(日)16:37 ID:+flcOJuk(1) AAS
普通に文を書く時でも()?!などの記号をASCII文字にするか全角文字にするか
濁点と半濁点を結合済み文字にするか別の文字にするかで迷ってしまう
294: 04/07(月)21:43 ID:1UVr/FZP(1) AAS
濁点と半濁点が別の文字だと認識しているのはおかしい
295: 04/08(火)17:04 ID:UfxEZoR8(1) AAS
まし"て"
296: 04/09(水)01:54 ID:t8BwIxsD(1) AAS
Windowsのエクスプローラーで見るとキャラクタセットによっては濁点が別の文字だとわからないことがある
297: 04/11(金)20:08 ID:i2PY9ZNn(1) AAS
朝鮮系の奴隷労働者が造ったと思われるサイトは
濁点が抜けてる気持ち悪いところがいくつかある
298
(1): 04/12(土)06:35 ID:IMDrBc8a(1) AAS
調整
外部リンク:techracho.bpsinc.jp
外部リンク:gigazine.net
477414164X
299: 05/02(金)09:50 ID:k5bGwZZ0(1) AAS
不可視化トラップで教育素材造るのはいいね
動画リンク[YouTube]

300: 05/02(金)18:10 ID:9xoZUliT(1) AAS
ユニコード悪用ヤバいな

>>298
>公式アプリと同じ開発者に見える名前で偽アプリが提供されました。
>この詐欺師は、印刷に現れないスペース文字を開発者名に混ぜ込むことでバリデーションのすり抜けに成功しました。
>このハックによって100万人以上が騙されました。
301: 05/02(金)20:30 ID:rPO248eK(1) AAS
>印刷に現れないスペース文字

誤訳だな
AIあほすぎ
302: 05/07(水)21:40 ID:9JkcRkxN(1) AAS
外部リンク:github.com

Joyo, JIS1, JIS2って何だよ
日本人向けのフォントなら日本人に分かるような書き方してくれ
303
(1): 05/08(木)02:26 ID:US+UAC1U(1/4) AAS
>>258
多分Mac OS Xのファイル名にNFDを採用したのは
辞書順がdiacriticsを無視する言語文化圏の人だったのでは
欧州では多数派だけど唯一ではない
>>121
OS kernelのsyscall部分で矯正してるわけではなくて
file system driverがやってる(ただしDarwinソースを確認したのは10年以上前)
だからUSBメモリだとかNFSだと、NFCでも書ける
ただし他の人も書いてる通りライブラリでも強制してる
CLIだと関係ない
304: 05/08(木)03:01 ID:US+UAC1U(2/4) AAS
ちなみにライブラリで必ずやることに変えれば
規格準拠にしやすいと思う
フル準拠にするとカーネルに入れるにはテーブルが大きすぎる
けどじゃあPython処理系はどうするんだ
osモジュールに担当させるのか
osモジュールみたいな機構がない言語処理系ではどうするんだ
とか色々大変
305
(1): 05/08(木)03:15 ID:US+UAC1U(3/4) AAS
要するにパス名正規化は無意味で無駄
306: 05/08(木)12:28 ID:of3Q4Bd7(1) AAS
ちっぱいでもいいじゃん
307: 05/08(木)16:10 ID:n8dUtc6U(1/2) AAS
>>305
いや正規化やっても良いんだよ
ただしやるなら規格書どおりにやれ
勝手仕様でやられると対応に困る
308
(1): 05/08(木)23:33 ID:pZAMgdYa(1) AAS
規格には則ってる
複数あって非互換なのが問題
309: 05/08(木)23:40 ID:n8dUtc6U(2/2) AAS
>>308
MacOS のやつは規格にあってないんだよ
しったかすんな
310: 05/08(木)23:51 ID:US+UAC1U(4/4) AAS
せめてNFCにしてればな
殆どの文書はNFCで構成されるんだから
それでもUnicodeは規格がバージョンごとに違うからなあ
正規化が無駄な努力
311
(1): 05/09(金)02:29 ID:3ts3cFTs(1) AAS
>>303
ファイルコピーとかするときは毎回、正規化の変換が発生する感じ?
(不明な正規化)->(特定の正規化) ってのは問題ないんだっけ?

一方でファイルビューア(Finder)とか上の方はどのFS上にいるとか意識
したくないだろうからなあ。そこでも正規化の変換が起こるのかな?
312: 05/09(金)11:12 ID:oh4Slinf(1) AAS
ファイルビューア
↓正規化
ファイルヒ゛ューア

こんなのやだな
313: 05/09(金)12:07 ID:OoJ+JMZS(1) AAS
EBCDICカナ文字の話みたい。
ごめんなさい、ごめんなさい、ごめんなさい。
314: 05/09(金)15:56 ID:yePfNbNe(1) AAS
>>311
最近macOSは余り触ってないが昔は
(様々な理由により以下の状況が起きて)
ファイルビューア
ファイルヒ゛ューア
の両方がディレクトリにある場合に、Finder.appでは
ファイルビューア
ファイルビューア
と表示され後者しかアクセス出来なかった
Cocoaが正規化してユーザやカーネルに渡すから
315: 05/13(火)18:18 ID:El9a77up(1) AAS
字にはヒラギノール
316
(3): 07/20(日)21:42 ID:v9zpB8iu(1) AAS
Microsoft Print to PDFで出力したファイルからテキストをコピペしたら文字化けしてた…→実はPDFの仕様に潜む本質的な欠陥が原因なのでは?
外部リンク:togetter.com
317
(3): 07/20(日)22:29 ID:0FYiUEbf(1) AAS
>>316
文字コードの問題ではなく単なるバグ
より正確にいうと大昔からある PDF のフォントの使い方の問題

PDF はウェブと違って文字コードをデフォルトでは埋め込んでなくてフォント内の番号で直接埋め込んでる
フィント番号と文字コードが1対1でマップしている保証はないのに、コピペの時はフォントに埋め込みの変換表で番号から文字コード生成する仕組になってる
複数の文字コードに同じフォントを割り当てているフォントを使うとこの問題が起きる
318: 07/22(火)01:09 ID:g3Tn7WHZ(1) AAS
>>316 みたいな奴が参政党に投票する
319: 07/22(火)12:00 ID:Yl+nv6VH(1) AAS
アドビはタイプセッター屋じゃけぇ、フォントファーストじゃけぇ
1-
あと 151 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.019s