文字コード総合スレ part15 (470レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
99: デフォルトの名無しさん [] 2024/11/21(木) 12:47:55.86 ID:SUxxkxcm UTF-8も完璧じゃないからな http://mevius.5ch.net/test/read.cgi/tech/1723861080/99
100: デフォルトの名無しさん [sage] 2024/11/21(木) 14:20:22.35 ID:GU8mH0bt >>99 キミの言う「完璧」とは一体... http://mevius.5ch.net/test/read.cgi/tech/1723861080/100
101: デフォルトの名無しさん [sage] 2024/11/21(木) 15:46:00.53 ID:/Qk0W5ej >>98 >そんなこと言いだしたら APFS も NTFS も単にバイト列を記録してるのに過ぎない。 いいえ http://mevius.5ch.net/test/read.cgi/tech/1723861080/101
102: デフォルトの名無しさん [] 2024/12/01(日) 10:32:32.38 ID:RvSn0UL0 UTF8を推しているのは形を変えたASCII信者の老害。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/102
103: デフォルトの名無しさん [sage] 2024/12/01(日) 11:15:01.77 ID:iESkoZBr 刷新できていない古いシステムを除くと 文字コードはユニコードになったね エンコーディングはネット上がUTF8なので それをそのまま扱うのが一般的となったね http://mevius.5ch.net/test/read.cgi/tech/1723861080/103
104: デフォルトの名無しさん [sage] 2024/12/01(日) 12:39:57.84 ID:8fzBRjbp UTF-8 より完璧な文字コードって何だい? ASCII と SJIS と UTF-8 はいいねしたい http://mevius.5ch.net/test/read.cgi/tech/1723861080/104
105: デフォルトの名無しさん [sage] 2024/12/01(日) 20:40:24.45 ID:NnL6xx/e なんか色々ごっちゃだな http://mevius.5ch.net/test/read.cgi/tech/1723861080/105
106: デフォルトの名無しさん [sage] 2024/12/02(月) 03:35:11.02 ID:okRPdXGy 元のユニコードがクソだからなあ 結局どうにもならなくなって異体字セレクタとか出てくるし http://mevius.5ch.net/test/read.cgi/tech/1723861080/106
107: デフォルトの名無しさん [] 2024/12/02(月) 13:49:05.08 ID:Zd1R379W ishの出力ってSJISが標準? utf-8板のish欲しいと思ったけど -Dutf8付けてコンパイルしても結局SJIS出力だった http://mevius.5ch.net/test/read.cgi/tech/1723861080/107
108: デフォルトの名無しさん [sage] 2024/12/02(月) 14:10:00.90 ID:n2j6TE+S バイトデータで出力してるだけでエンコーディング関係ないような UTF-8対応してもバイト単位でみたら7ビットしか情報持てないから損 効率気にしないならコード変換したらいい 半角カナが3バイトになるけどエラー訂正なんかは使える http://mevius.5ch.net/test/read.cgi/tech/1723861080/108
109: デフォルトの名無しさん [sage] 2024/12/03(火) 12:52:43.59 ID:DZc+/1dr たまたまSJISでデコードしたら人間に読める(かもしれない)ってだけで 只のバイナリデータだよね http://mevius.5ch.net/test/read.cgi/tech/1723861080/109
110: デフォルトの名無しさん [sage] 2024/12/04(水) 23:36:37.56 ID:9B20CEFA SJISとして不正なバイト列は含まれないはず http://mevius.5ch.net/test/read.cgi/tech/1723861080/110
111: デフォルトの名無しさん [sage] 2024/12/05(木) 16:18:11.64 ID:riH9D2sC ファイル名がユニコードだと、 例えば2つのファイル名が同一かどうかの判定は、2つのユニコード列が同一かどうかの 判定をしなくてはならない。この場合の同一とはなんだろう。めんどくさい http://mevius.5ch.net/test/read.cgi/tech/1723861080/111
112: デフォルトの名無しさん [sage] 2024/12/05(木) 16:59:22.16 ID:jrS77sb5 >>111 「ユニコード列」みたいな曖昧な用語で考えると曖昧な結果にしかならなんわな http://mevius.5ch.net/test/read.cgi/tech/1723861080/112
113: デフォルトの名無しさん [sage] 2024/12/05(木) 17:16:36.01 ID:jrS77sb5 「ファイル名」という用語に限ってもOSごとに異なる意味をもち、「バイト列/コードポイント表現」(Linux/Windows)と「 unicode 正規化表現」(MacOS)のどっちのやり方もあるし unicode の正規化には複数の種類がある http://mevius.5ch.net/test/read.cgi/tech/1723861080/113
114: デフォルトの名無しさん [] 2024/12/05(木) 19:21:14.57 ID:f+d6ZP2R >>103 ネットはJISもあるから、そう簡単な話ではない。 EメールだとまだJISが主流。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/114
115: デフォルトの名無しさん [] 2024/12/05(木) 19:22:28.03 ID:f+d6ZP2R >>113 Macのせいで記号や改行コードの解釈がめちゃくちゃになった。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/115
116: デフォルトの名無しさん [sage] 2024/12/05(木) 22:25:20.82 ID:Kc+yIq6Q >>111はあえて雑に書いてあるんだが(めんどくさいからw) >>113は「曖昧じゃない」んだ? http://mevius.5ch.net/test/read.cgi/tech/1723861080/116
117: デフォルトの名無しさん [sage] 2024/12/05(木) 23:11:23.50 ID:+y5lu+gF 見苦しいぞ http://mevius.5ch.net/test/read.cgi/tech/1723861080/117
118: デフォルトの名無しさん [] 2024/12/06(金) 10:53:27.12 ID:zw4qy2EX ハンカクカタカナ.txtと ハンカクカタカナ.txtは 区別されると困るか区別して欲しいかは個人の好みだな http://mevius.5ch.net/test/read.cgi/tech/1723861080/118
119: デフォルトの名無しさん [sage] 2024/12/06(金) 11:15:10.72 ID:kzR0LSsc >>111,118 主観と好みの問題だから、現状がそれを孕んでいるかどうか心配ならNKFCで突合チェックしたら良いだけかな http://mevius.5ch.net/test/read.cgi/tech/1723861080/119
120: デフォルトの名無しさん [sage] 2024/12/06(金) 13:01:51.55 ID:tlsLperd >>118 自分はまったく別物だろうという考えだが、逆にそれを同じと思う人がいるというのに驚きだ http://mevius.5ch.net/test/read.cgi/tech/1723861080/120
121: デフォルトの名無しさん [sage] 2024/12/06(金) 14:57:12.37 ID:PqgirqmV MacOS/iOS だと OS 的にファイル名はNFD強制なのでその2つ区別できないのが普通だな Macユーザーは「半角カナはファイル名には使えない」という言い方してることが多いけど http://mevius.5ch.net/test/read.cgi/tech/1723861080/121
122: デフォルトの名無しさん [sage] 2024/12/06(金) 15:08:33.92 ID:teqNcVuG Windowsは大文字小文字の区別を付けないのがデフォルトなんだけど、 WSL内からアクセスする兼ね合いで区別設定できる(fsutil) >>121 Macにも同様の理由でNFD強制解除の設定があるのでは? http://mevius.5ch.net/test/read.cgi/tech/1723861080/122
123: デフォルトの名無しさん [sage] 2024/12/06(金) 17:09:11.54 ID:PqgirqmV >>122 強制解除とかはなかったと思うが古い HFS+ と違って新しい APFS では論理的には書き込み可能なはず 一方でライブラリで、ファイルオープンする時にファイル名が強制的にNFD変換されるので通常のプログラムでは全部NFDになるのは避けられない http://mevius.5ch.net/test/read.cgi/tech/1723861080/123
124: デフォルトの名無しさん [sage] 2024/12/06(金) 20:10:41.64 ID:77CvoLMD Macが一番遅れているのは意外だな > Mac で NAS (SMB) のファイルが見えない問題を Unicode 正規化方式を変えて解決 > Unicode 正規化方式として NFD を採用しているのは Mac なのに,SMB (NAS) を介してみると当の Mac だけがそういったファイルを認識できない(ことがある)というのはなんとも皮肉な結果ですね...。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/124
125: デフォルトの名無しさん [sage] 2024/12/06(金) 21:07:04.96 ID:PqgirqmV >>124 Mac はローカルファイルは NFD (っぽい独自仕様)で正規化されてる前提で、リモートのSMBの先は NFC (っぽい独自仕様)で正規化されている前提で動作するという謎仕様なので Lunux は基本的に正規化されずに全部別の文字扱いで unicode の全文字が使える Windows も基本的には正規化を前提にしていないが独自仕様の使えない文字がある http://mevius.5ch.net/test/read.cgi/tech/1723861080/125
126: デフォルトの名無しさん [sage] 2024/12/06(金) 21:22:50.16 ID:XSDLieo6 わかりやすいようにたとえで説明するとさ、 オマエんちに人を招待したら、土足のまま上がってきた オマエはイラっとするんじゃね? はいオマエ遅れてる〜 http://mevius.5ch.net/test/read.cgi/tech/1723861080/126
127: デフォルトの名無しさん [sage] 2024/12/06(金) 21:35:56.15 ID:PqgirqmV 服装カジュアルな場所でも常にスーツ着てきてスーツ着てないやつは家族だろうと友人だろうと全員無視するのが Mac 仕草 その上、自宅用と訪問用に別の種類のスーツを使い分けてて同じ種類のスーツ着てないと相手してくれない http://mevius.5ch.net/test/read.cgi/tech/1723861080/127
128: デフォルトの名無しさん [sage] 2024/12/07(土) 10:53:50.76 ID:+zec5U9G UnicodeはUnicodeで様々な言語の様々な表現ができるようにするなかで一意性についても 用途や目的によって方法は異なるとしているわけで、そもそもファイルをファイル名で特定するという 昔ながらのやり方との齟齬が出てきているのかもね。 使うなら使うでファイルシステムに用いる正規化ルールなどを定めなければならないんだろう。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/128
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 342 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.011s