[過去ログ] 文字コード総合スレ part8 (1001レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1: 2012/11/30(金)13:16 AAS
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 2chスレ:tech
文字コード総合スレ part2 2chスレ:tech
文字コード総合スレ part3 2chスレ:tech
文字コード総合スレ part4 2chスレ:tech
(スレ再利用)UnicodeとUTF-8の違いは? 2chスレ:tech
(隔離スレ)UnicodeとUTF-8の違いは? その2 2chスレ:tech
文字コード総合スレ part5 2chスレ:tech
文字コード総合スレ part6 2chスレ:tech
文字コード総合スレ part7 2chスレ:tech
2: 2012/11/30(金)13:19 AAS
待ってたよ!
動画リンク[YouTube]
3(2): 2012/11/30(金)14:18 AAS
■参考サイト
Unicode Home Page
外部リンク:www.unicode.org
Java Character Encodings
外部リンク:www.ingrid.org
euc.JP: tech docs, BeOS tools
外部リンク:euc.jp
ISO-IR - 2.8.1 Coding systems with Standard return
外部リンク[htm]:www.itscj.ipsj.or.jp
ISO-IR - 2.8.2 Coding Systems without Standard return
外部リンク[htm]:www.itscj.ipsj.or.jp
IANA: Character Sets
外部リンク:www.iana.org
Legacy Encoding Project
外部リンク:sourceforge.jp
CP50220
森山さんの説明
外部リンク[html]:lists.sourceforge.jp
JISX4061
日本語文字列照合順番
外部リンク:www.jisc.go.jp
4(4): 2012/11/30(金)14:19 AAS
■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
上下前次1-新書関写板覧索設栞歴
あと 997 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.011s