[過去ログ] 文字コード総合スレ Part12 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
4: デフォルトの名無しさん [sage] 2018/12/16(日) 12:46:00.56 ID:VlX3xGEw(4/7) AAS
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
138
(4): デフォルトの名無しさん [sage] 2019/01/22(火) 23:10:13.56 ID:MZI8yiK5(1) AAS
>>133
133(1): ◆QZaw55cn4c [sage] 2019/01/22(火) 02:34:15.81 ID:zFHfz07h(2/2) AAS
>>132
現に存在するUTF-32/UTF-8 という文字コードの集合を使用した場合に日本語と中国語の漢字を
?:同一文書に含ませることは可能でしょうか??:?が可能であったとして、PC の画面にて同時に表示することは可能でしょうか?
より正確に言えば、
保存するときにローカルの文字コードに変換してるソフトかもしれないのでそのソフトの仕様による
例えば英文フォントしかないPCだと漢字は表示できないだろうから表示できるかどうかは環境による
だろう

>>131
131(5): ◆QZaw55cn4c [sage] 2019/01/22(火) 01:05:00.00 ID:zFHfz07h(1/2) AAS
漢字コードのことでわからなくなりましたので質問いたします。
よろしくお願いいたします。

外部リンク[html]:pc.watch.impress.co.jp
>文字データをシフトJISではなく、Unicodeで保存するとどんないいことがあるのか。
>たとえばUnicodeならあらゆる言語の文字を混在させることができる。
>Wordでしか文書を書かないエンドユーザーにはそんなこと当たり前じゃないかと言われそうだが、

これって本当ですか?

私見では日本語の漢字と中国語の漢字を同一文書にて同時に表示できないし混在もできない、と思っていたんですが…。
CJK 漢字統合の影響はもう過去の話になってしまったんでしょうか?
あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理だと思うがなあ
182: デフォルトの名無しさん [] 2019/02/10(日) 20:01:32.56 ID:MigChu0H(2/2) AAS
🍭
あめ


296
(1): デフォルトの名無しさん [sage] 2019/04/22(月) 02:38:56.56 ID:V0Ep5EOp(1) AAS
鋤?
308: デフォルトの名無しさん [] 2019/04/30(火) 02:48:38.56 ID:qV7WSa+K(1) AAS
一応アプデして再起動した
外部リンク:support.microsoft.com
いつでも来やがれ
437: デフォルトの名無しさん [sage] 2019/06/10(月) 14:06:48.56 ID:DwfAnHcn(3/4) AAS
ていうかそもそも漢字構成記述文字列自体がポーランド記法っぽい性格を持ってる。
⿰⿱山上下なら⿰(⿱(山, 上), 下)みたいな関数表示になって↑>>434
434(1): デフォルトの名無しさん [sage] 2019/06/10(月) 11:14:02.36 ID:DwfAnHcn(1/4) AAS
>>433
最後のは不正では。
⿰⿱山上下なら
↓こんな文字になっちゃう
みたいな字形になる。
599: デフォルトの名無しさん [sage] 2019/08/31(土) 15:37:04.56 ID:3i1dPJsj(1/3) AAS
>>598
598(1): デフォルトの名無しさん [] 2019/08/31(土) 15:35:30.15 ID:SHne0DDt(2/2) AAS
6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ
それは理由が書いてないから、読む価値ある?
603: デフォルトの名無しさん [sage] 2019/08/31(土) 17:59:12.56 ID:Yn5v13ie(1) AAS
ネットウヨw
618
(1): デフォルトの名無しさん [sage] 2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH(1/2) AAS
>>616
616(1): デフォルトの名無しさん [] 2019/09/01(日) 13:42:43.07 ID:k0czTyLP(2/3) AAS
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる

あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。

>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。

シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。

>UTF32が21bitコードになってしまったのはUTF-8のせいだ

UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。

>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。

>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない
645
(1): デフォルトの名無しさん [sage] 2019/09/04(水) 01:38:53.56 ID:Gs/bLtCt(1) AAS
一橋大学アウティング事件でググれ
990: デフォルトの名無しさん [sage] 2020/07/02(木) 05:58:14.56 ID:29pTsVv7(1) AAS
>>989
989(2): デフォルトの名無しさん [sage] 2020/07/01(水) 22:04:25.91 ID:21fnQhh9(1) AAS
「包摂」の概念を知らないといけないな。
「包摂 文字コード」で検索すると出てくるが、「そ」や「り」は一画で
書く場合と、二画で書く場合があるが、それは「同一の文字であって
字体が異なるだけ」とみなすのが「包摂」ということ。

「高」と「??」は別の文字と考えられ、「包摂」されていない。
すなわち文字コードも分けられている。これは、unicodeで規定された
以上、もう変えることはできない。
(1) 日本(JIS)では包摂されてた
(2) 台湾では包摂されてなかった -> Unicode で採用
(参考) CP932では包摂されてない -> 5chは実際にはCP932、ということでいいのかな?

Unicodeで別になってて嬉しい人は台湾に感謝しないとw
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.057s