[過去ログ] 文字コード総合スレ Part12 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
589: デフォルトの名無しさん [] 2019/08/30(金) 13:00:23.27 ID:oVszNH41(1/2) AAS
>>579
579(1): デフォルトの名無しさん [sage] 2019/08/29(木) 19:11:19.48 ID:YrWceYNE(1) AAS
複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない
codecvtは糞だ
590: デフォルトの名無しさん [] 2019/08/30(金) 13:03:12.55 ID:oVszNH41(2/2) AAS
>>580
580(1): デフォルトの名無しさん [] 2019/08/29(木) 20:02:33.30 ID:jljmwQsV(1/3) AAS
プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。
だった
まあどっちでもいいけど
591
(2): デフォルトの名無しさん [] 2019/08/30(金) 15:32:59.58 ID:6uSriybI(1) AAS
>>588
588(1): デフォルトの名無しさん [sage] 2019/08/30(金) 01:29:38.44 ID:/ghu33Nb(1) AAS
>>586
ではどうぞ御説明をどうぞw
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。
592
(1): デフォルトの名無しさん [sage] 2019/08/30(金) 15:56:24.57 ID:iPGqG8dk(1) AAS
>>591
それぐらいみんな知ってる
593: デフォルトの名無しさん [] 2019/08/30(金) 17:05:21.42 ID:GEn/r+mZ(1/2) AAS
>>592
それぐらいみんな知ってる
594: デフォルトの名無しさん [] 2019/08/30(金) 17:19:36.31 ID:57FOZgRt(1) AAS
ビットサイズ固定でどうにかなると思っていた時期が俺にもありました。
595: デフォルトの名無しさん [] 2019/08/30(金) 17:27:36.02 ID:GEn/r+mZ(2/2) AAS
定期
貼れるんかこれ
外部リンク:qiita.com
596
(1): デフォルトの名無しさん [sage] 2019/08/31(土) 10:08:53.77 ID:0iGUnrw4(1/3) AAS
>>591
スレの流れみた?UTF-32の話をしてんだぞ?
597
(1): デフォルトの名無しさん [] 2019/08/31(土) 15:33:43.16 ID:SHne0DDt(1/2) AAS
>>596
そのまえ
598
(1): デフォルトの名無しさん [] 2019/08/31(土) 15:35:30.15 ID:SHne0DDt(2/2) AAS
6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ
599: デフォルトの名無しさん [sage] 2019/08/31(土) 15:37:04.56 ID:3i1dPJsj(1/3) AAS
>>598
それは理由が書いてないから、読む価値ある?
600: デフォルトの名無しさん [sage] 2019/08/31(土) 15:45:23.47 ID:4qIvp+ND(1) AAS
なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ
601: デフォルトの名無しさん [sage] 2019/08/31(土) 15:56:52.05 ID:3i1dPJsj(2/3) AAS
ん?支持しなくて良いよ
602: デフォルトの名無しさん [sage] 2019/08/31(土) 17:12:51.44 ID:0iGUnrw4(2/3) AAS
>>597
じゃあ >>586
586(2): デフォルトの名無しさん [] 2019/08/30(金) 00:11:25.73 ID:h/StilS8(1) AAS
文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw
はスレの流れを遮って,古い話題を煽り文句で蒸し返した挙句,
碌な知識も持ってないことを晒してしまったヤベー奴ってことになるけどいいの?
603: デフォルトの名無しさん [sage] 2019/08/31(土) 17:59:12.56 ID:Yn5v13ie(1) AAS
ネットウヨw
604: デフォルトの名無しさん [] 2019/08/31(土) 20:21:37.85 ID:5EL66xzp(1) AAS
re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。
605: デフォルトの名無しさん [sage] 2019/08/31(土) 22:52:53.39 ID:0iGUnrw4(3/3) AAS
寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。
606: デフォルトの名無しさん [sage] 2019/08/31(土) 22:58:57.55 ID:3i1dPJsj(3/3) AAS
UTF-32対応は難しいから無理だろ
607: デフォルトの名無しさん [] 2019/09/01(日) 01:36:48.58 ID:sYwYgS29(1) AAS
iconv禁止
608: デフォルトの名無しさん [sage] 2019/09/01(日) 09:07:17.74 ID:XF6G4Ohn(1) AAS
NKF(Network Kanji code conversion Filter)を使えば?

Ruby にも、NKF モジュールがある
609: デフォルトの名無しさん [sage] 2019/09/01(日) 10:46:26.40 ID:YneNC5Ev(1) AAS
別にコード変換ツールを探してるわけじゃなくね?w
610: デフォルトの名無しさん [] 2019/09/01(日) 10:52:49.46 ID:kCJZVLuH(1/2) AAS
どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決
611
(1): デフォルトの名無しさん [] 2019/09/01(日) 12:53:54.91 ID:k0czTyLP(1/3) AAS
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。
612
(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb(1) AAS
>>611
いろいろ間違ってるなw

まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
613
(1): デフォルトの名無しさん [sage] 2019/09/01(日) 13:11:25.72 ID:xmxF7u0H(1) AAS
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
1-
あと 389 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.012s