[過去ログ]
文字コード総合スレ Part12 (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
7
: 2018/12/16(日)12:49
ID:VlX3xGEw(7/7)
AA×
http://masaka.dw.land.to/mr/jmr.php
[
240
|
320
|480|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
7: [sage] 2018/12/16(日) 12:49:13 ID:VlX3xGEw ■単語一覧 ・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある 表現できる文字空間はUTF-8と同じく20ビットとちょっと ・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。 今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。 似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、 素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。 ・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある ・MSでのウニコードとSJIS変換のバグ。 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】 ・SafariでのウニコードとSJIS変換のバグ。 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA ・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで 再変換しているので、それをしなければよい。 ・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。 ・JISのエスケープシーケンスが正しく認識されない本文とか。 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/7
単語一覧 はビット単位にエンコードするけどサロゲートペアがある 表現できる文字空間はと同じくビットとちょっと 丸付き数字は機種依存文字か?ではに収録されてない文字は環境依存文字って表示 ではフォントによっては表示されないしフォントによっては表示される 今の内部アプリはフォント依存ではなくアプリ依存 似非や似非のドキュメント中の丸付き数字は 素直にのを使ってるアプリならゲタになる ではに収まらずに収まるメールは含まれる字種によって で送信される場合ともどきで送信される場合がある でのウニコードと変換のバグ の問題 の問題 でのウニコードと変換のバグ の問題 の規格ではファイル名のコードページ指定もしくは記録情報が存在しない 解決策取り合えずではでファイル自体には保存されている どれでもありえる文字に関係なくで 再変換しているのでそれをしなければよい での文字列長の判定はプラットフォームにより返り値が違う機種依存文字等マニュアル嫁 のエスケープシーケンスが正しく認識されない本文とか というバイトを先頭に を末尾に追加汁 あるいはとか
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 995 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
ぬこの手
ぬこTOP
0.056s