[過去ログ] 文字コード総合スレ Part12 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
598
(1): デフォルトの名無しさん [] 2019/08/31(土) 15:35:30.15 ID:SHne0DDt(2/2) AAS
6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ
599: デフォルトの名無しさん [sage] 2019/08/31(土) 15:37:04.56 ID:3i1dPJsj(1/3) AAS
>>598
それは理由が書いてないから、読む価値ある?
600: デフォルトの名無しさん [sage] 2019/08/31(土) 15:45:23.47 ID:4qIvp+ND(1) AAS
なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ
601: デフォルトの名無しさん [sage] 2019/08/31(土) 15:56:52.05 ID:3i1dPJsj(2/3) AAS
ん?支持しなくて良いよ
602: デフォルトの名無しさん [sage] 2019/08/31(土) 17:12:51.44 ID:0iGUnrw4(2/3) AAS
>>597
597(1): デフォルトの名無しさん [] 2019/08/31(土) 15:33:43.16 ID:SHne0DDt(1/2) AAS
>>596
そのまえ
じゃあ >>586
586(2): デフォルトの名無しさん [] 2019/08/30(金) 00:11:25.73 ID:h/StilS8(1) AAS
文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw
はスレの流れを遮って,古い話題を煽り文句で蒸し返した挙句,
碌な知識も持ってないことを晒してしまったヤベー奴ってことになるけどいいの?
603: デフォルトの名無しさん [sage] 2019/08/31(土) 17:59:12.56 ID:Yn5v13ie(1) AAS
ネットウヨw
604: デフォルトの名無しさん [] 2019/08/31(土) 20:21:37.85 ID:5EL66xzp(1) AAS
re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。
605: デフォルトの名無しさん [sage] 2019/08/31(土) 22:52:53.39 ID:0iGUnrw4(3/3) AAS
寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。
606: デフォルトの名無しさん [sage] 2019/08/31(土) 22:58:57.55 ID:3i1dPJsj(3/3) AAS
UTF-32対応は難しいから無理だろ
607: デフォルトの名無しさん [] 2019/09/01(日) 01:36:48.58 ID:sYwYgS29(1) AAS
iconv禁止
608: デフォルトの名無しさん [sage] 2019/09/01(日) 09:07:17.74 ID:XF6G4Ohn(1) AAS
NKF(Network Kanji code conversion Filter)を使えば?

Ruby にも、NKF モジュールがある
609: デフォルトの名無しさん [sage] 2019/09/01(日) 10:46:26.40 ID:YneNC5Ev(1) AAS
別にコード変換ツールを探してるわけじゃなくね?w
610: デフォルトの名無しさん [] 2019/09/01(日) 10:52:49.46 ID:kCJZVLuH(1/2) AAS
どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決
611
(1): デフォルトの名無しさん [] 2019/09/01(日) 12:53:54.91 ID:k0czTyLP(1/3) AAS
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。
612
(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb(1) AAS
>>611
いろいろ間違ってるなw

まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
613
(1): デフォルトの名無しさん [sage] 2019/09/01(日) 13:11:25.72 ID:xmxF7u0H(1) AAS
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
614
(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:35:49.57 ID:JCPxJyAV(1/2) AAS
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ
615: デフォルトの名無しさん [] 2019/09/01(日) 13:40:59.73 ID:kCJZVLuH(2/2) AAS
>>612
おまいもかなり可笑しいなω
616
(1): デフォルトの名無しさん [] 2019/09/01(日) 13:42:43.07 ID:k0czTyLP(2/3) AAS
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる

あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。

>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。

シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。

>UTF32が21bitコードになってしまったのはUTF-8のせいだ

UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。

>21
21(1): デフォルトの名無しさん [] 2018/12/19(水) 01:12:57.34 ID:jOXn0Ht9(5/5) AAS
ちなみipアドレスの並びはビックエンディアンになってる
ポート番号も当然ビックエンディアンになってる

ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ

ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる

ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる
bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。

>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
617: デフォルトの名無しさん [sage] 2019/09/01(日) 14:01:22.04 ID:JCPxJyAV(2/2) AAS
(もしかして: フォント)
618
(1): デフォルトの名無しさん [sage] 2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH(1/2) AAS
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない
619
(1): デフォルトの名無しさん [] 2019/09/01(日) 14:29:25.97 ID:k0czTyLP(3/3) AAS
>>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。
620: デフォルトの名無しさん [sage] 2019/09/01(日) 14:38:49.28 ID:5y1tL0M+(1) AAS
>>619
エンコードと文字コードを混ぜんな
おまえみたいな奴がいるから混乱するんだよ
少しは馬鹿を自覚して黙ってろ
621: デフォルトの名無しさん [sage] 2019/09/01(日) 15:12:24.21 ID:VpClr4jS(1) AAS
>>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが
622: デフォルトの名無しさん [sage] 2019/09/01(日) 15:24:13.07 ID:Cv4S4gQH(2/2) AAS
>>614
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www
1-
あと 380 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.014s