[過去ログ]
文字コード総合スレ part8 (1001レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
5
(2)
:
2012/11/30(金)14:19
AA×
[
240
|
320
|
480
|600|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
5: [sage] 2012/11/30(金) 14:19:56.25 ・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る ・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない ・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか) ・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES ・UnicodeとUTF-8の違いは? ・日本のCJK Ext.D Submissionに{魚針}が含まれてる件 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針) ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。 中国ではってレベルじゃねーぞ。 ・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで) サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い) ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。 ・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。 ・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。 ・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ ・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか ・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。 ・Unicodeサニタイズが面倒になるのか http://peace.5ch.net/test/read.cgi/tech/1354248962/5
中国語の簡体字ではへんやつくりが簡略化されるならその文字も自動的に簡略化して表記する国家規格が有る 中国語の心簡化政策によるとに統一口偏は普通に使われているがにはない 日本人のニーズが満たせないのも確かなので原規格分離中国では曾曽は簡体字と繁体字の違いとはみなされていないとか を扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって との違いは? 日本の に魚針が含まれてる件 魚は強烈いくら何でも違いすぎる魚針 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ 中国ではってレベルじゃねーぞ での パッド 文字一覧の 面のバグ 間違い はまで サロゲートペアからコードポイントを引き出す計算を無理やり適用間違い が になる 文字コードではインドカレーは飲み物か否かカレーパンうまうま 混在の漢字環境ってどうやって切り分ければいいの? ムリです で保存されるファイル名が文字化けではコードページ情報が無い直接ファイルから切り出せ は言語情報を直接扱わない 多言語の混在表現はではできないか 文字列リストを各国言語を考慮してソートしたいんですが ムリです サニタイズが面倒になるのか
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 996 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.054s