[過去ログ] 文字コード総合スレ part2 (982レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1
(1): デフォルトの名無しさん [sage] 2006/03/26(日) 21:20:39 AAS
プログラムにおける各種文字コードの処理について語りましょう♪

■前スレ
文字コード統一スレ 1文字目
2chスレ:tech

■関連スレ
文字コードの種類は何故複数あるのでしょうか?
2chスレ:tech

■参考サイト
Unicode Home Page
外部リンク:www.unicode.org
Java Character Encodings
外部リンク:www.ingrid.org
euc.JP: tech docs, BeOS tools
外部リンク:euc.jp
ISO-IR - 2.8.1 Coding systems with Standard return
外部リンク[htm]:www.itscj.ipsj.or.jp
ISO-IR - 2.8.2 Coding Systems without Standard return
外部リンク[htm]:www.itscj.ipsj.or.jp
958: デフォルトの名無しさん [sage] 2007/05/02(水) 05:28:58 AAS
>>606
606(2): デフォルトの名無しさん [sage] 2006/11/09(木) 15:34:06 AAS
読みは持っている、あるいは持ってないので読み順はあきらめると仮定して、

JISX4061
日本語文字列照合順番
外部リンク:www.jisc.go.jp
のサイトで規格票を読める。
959: デフォルトの名無しさん [sage] 2007/05/02(水) 14:58:20 AAS
>>951
951(1): デフォルトの名無しさん [sage] 2007/04/26(木) 15:25:01 AAS
MacでAJ15使ってれば
そのうちIVSの読み込み/書き出しがサポートされるんじゃね?
少し試してみました。TextEdit.appのRTFってCID埋め込めるんですね。

で、異体字を Excel とかでも使いたいんですが、
タイプセットと関係ない一般のアプリでCIDを使う訳にはいかないんでしょうねえ。
960: デフォルトの名無しさん [sage] 2007/05/03(木) 15:00:35 AAS
日本では公的な標準があまりに非力だから仕方なく一部で使われてるけど
CIDってそもそもそういうこと(一般的な情報交換)に使うためのものじゃないからねえ
まさにそのためにIVSが定義されようとしているわけだし
961: デフォルトの名無しさん [sage] 2007/05/03(木) 15:15:13 AAS
>>944
944(1): デフォルトの名無しさん [sage] 2007/04/20(金) 01:13:21 AAS
ブラウザの勝手な拡張というかお節介なだけ。
実体参照の大文字小文字の区別だとか;の省略だとかそういった
いやーな実装の一つだな。

# n文字以上入力してくださいというところにサロゲートペアで
# ねじこむとか荒業出来そうだねぇ。>セキュリティ方面
# あ、あと別に16進じゃなくて10進で書いても同じ動作だろう。
;の省略はブラウザのお節介ではなく仕様で認められてる場合がある。
962: デフォルトの名無しさん [sage] 2007/05/03(木) 15:18:54 AAS
>>937
937(1): デフォルトの名無しさん [sage] 2007/04/19(木) 00:20:12 AAS
今思ったんだけどUnicodeの注音字母はU+3105から始まっててU+3100〜U+3104が空いてるのは何でだろ?
昔は原規格の並びをそれなりに反映してるっぽい並びで収録されることがあったからだと
思われ(Big5のbopomofoは0xA375〜)。
BMPに余裕がなくなってきた最近ではとにかく空いてるところに詰め込む感じになってるけど
963: デフォルトの名無しさん [sage] 2007/05/03(木) 15:26:42 AAS
> Big5のbopomofoは0xA375〜
すまん嘘だった。0xA374〜じゃんorz
964: デフォルトの名無しさん [sage] 2007/05/11(金) 23:44:52 AAS
Extension Cに投票でツッコミが入りまくってAmd.5に回された。
まあレビューが正常に機能してる証拠だとも言えそうだが。
Adobe-Japan1がAmd.3に入りそうなのはいいけど早すぎて品質が心配
965: デフォルトの名無しさん [sage] 2007/05/16(水) 09:38:38 AAS
Wikipedia に

UCS-4
 31ビットを使うコード。4バイトを基本とするUCS。Unicodeの符号化方式であるUTF-32と似ている。
 Unicode以外のコード(0x10FFFF以降)も使用できるという点が異なっていたが、
 2006年の改訂によりUnicodeで使用できない領域には永久に文字が定義されないこととなった。
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
って書いてあるんですけど、
ISO/IEC 10646 自体が 22〜31 ビット目を使わなくなった、ということではなくて、
ISO/IEC 10646 のサブセットである UCS-4 は 22〜31 ビット目を使わないけど、
ISO/IEC 10646 自体はまだ 22〜31 ビット目を持つ文字も使えるようになってる、
ということなのでしょうか?
966: デフォルトの名無しさん [sage] 2007/05/16(水) 10:46:40 AAS
ISO10646=Unicodeなので22〜31ビット目は使われない。
967
(1): デフォルトの名無しさん [sage] 2007/05/16(水) 11:56:19 AAS
ISO/IEC 10646 ⊃ Unicode ではなくて?
968: デフォルトの名無しさん [sage] 2007/05/16(水) 12:30:44 AAS
>>967
その認識は古い。
969
(1): デフォルトの名無しさん [sage] 2007/05/16(水) 12:43:08 AAS
うーん。
外部リンク[html]:www.unicode.org
にある
>文字コードと符号化方式は同期を取っていますが、Unicodeは実装上の適合性を重視しています。
>このため、ISO/IEC 10646で規定していない、拡張した機能文字、文字データ、アルゴリスム、背景資料などを提供しています。
というのが微妙に分からないんですけど、
要するに ISO/IEC 10646 は文字コードや符号化方式のみを規定していて、
Unicode はそれを実際に実装する際の話も規定しているという話であってますか?
970: デフォルトの名無しさん [sage] 2007/05/16(水) 13:21:27 AAS
UCS は Unicode にはないよね?
971: デフォルトの名無しさん [sage] 2007/05/16(水) 13:24:24 AAS
Unicode は UCS にはないよね?
972: デフォルトの名無しさん [sage] 2007/05/16(水) 13:30:51 AAS
あいや、UCS-2 や UCS-4 という用語は Unicode にはないよね、と。
973: デフォルトの名無しさん [sage] 2007/05/16(水) 13:56:42 AAS
ナイアルヨ
974: デフォルトの名無しさん [sage] 2007/05/16(水) 14:33:10 AAS
結局 UCS の群(group)って意味なかったのかね。
975: デフォルトの名無しさん [sage] 2007/05/16(水) 15:16:48 AAS
UCS-3が開発されたりしてw
976
(1): デフォルトの名無しさん [sage] 2007/05/16(水) 15:39:10 AAS
The most significant octet of this sequence shall be the group-octet.

とまで書かれていたのに・・・。
977: デフォルトの名無しさん [sage] 2007/05/17(木) 02:50:46 AAS
>>976
それは「BEだぞおめーら」って意味じゃ?
978: デフォルトの名無しさん [sage] 2007/05/17(木) 04:03:12 AAS
そういう場合に significant って使うの?
979: デフォルトの名無しさん [sage] 2007/05/17(木) 10:35:51 AAS
「最上位ビット」という意味の "MSB" の S は Significant だよ。
980: デフォルトの名無しさん [sage] 2007/05/17(木) 10:55:02 AAS
なるほど。そうなんだ。
981: デフォルトの名無しさん [sage] 2007/05/17(木) 21:22:01 AAS
>>969
> 文字コードと符号化方式は同期を取っていますが、

文字コードも符号化方式も
UnicodeとISO/IEC 10646の間で同期していますが、

> Unicodeは実装上の適合性を重視しています。

Unicode標準は、プラットフォームやアプリケーションが違っても、
統一的に文字を扱う事を確実にする実装上の制約も課しています。

「要するに〜?」についてはYES。
実装を規程している訳じゃなくて、
(実装するなら当然必要になるような)その他のことも規定してる。
「実装」に特にこだわってその文を解釈する必要はない。
982: デフォルトの名無しさん [sage] 2007/05/18(金) 06:13:56 AAS
なるほど。よくわかりました。
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.190s*