[過去ログ] 文字コード総合スレ Part12 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
6: デフォルトの名無しさん [sage] 2018/12/16(日) 12:48:18.57 ID:VlX3xGEw(6/7) AAS
■ライブラリ
ICU - International Components for Unicode
外部リンク:site.icu-project.org
mlang
外部リンク[aspx]:msdn.microsoft.com
iconv
外部リンク:www.gnu.org
ICU
外部リンク:www.icu-project.org
NKF32.DLL (非推奨)
外部リンク[html]:www.vector.co.jp
7: デフォルトの名無しさん [sage] 2018/12/16(日) 12:49:13.25 ID:VlX3xGEw(7/7) AAS
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいは外部リンク[php]:masaka.dw.land.toとか。
8: デフォルトの名無しさん [sage] 2018/12/16(日) 17:19:29.50 ID:0LUE4AGb(1) AAS
oo|o|o|||o|o|o|o|||ooo|oo|o|ooooo||o||o|oooo|||o||||o|oo|o|||o|o|o|o|o|oo
ooo||o|o|||||||o|o||oo|ooo||ooo|o||oooo|oo|o||oo|||ooo||||oo||ooooo||oo||
oo||ooo|o||o||ooooo|oo|oo|o|o|||o|||||o|o|oo||oo|ooo||o||||o|o||o||o|oooo
ooo|||||o|oo|||ooo|o|oo|||||ooooooooooo|||ooo|||o||||oo|oo|||ooo|o||oo|||
ooooo|ooo||o|oo|||oooo|oo|||||ooooo||o|||oo|||o|o|o|o||||o|||||oo|oo|oo|o
||o|oo||oooooo||o|oo||o|||ooo||oo||oo||ooo|o|o|oo|||||o|o|o|||oooooo|o|||
||o||||o|oo|||o||oo||ooo|ooo|oo|||oo|o|||o|||oo|oo|oo|o|||||oooo||ooooooo
oo|oo|||||oo|||||o|oo|o||oo|||o|ooo||o|oo|||o||ooooooooo|ooooo|o|||o||o||
o|oo|o||o|oo|oo|oo|o|o|o|oo|o||||oo|oo||ooo|ooooo||||o|oo|oo|||o|||oo||||
|o||||o|||oo|o||o||oo||oooo|oo|o||oooo|oo|||||||oo|o|o|ooo|oooo||||ooo|oo
ooooo|||oo||oo|o||o|ooooooo||||||o|o||o|o|ooo||oo||o||oooo||oo|oo|||o||||
|o|||oo||o||o|o|||o||oooo|oo|||o||oo|ooooo|o|||o|||oo|ooo|ooo|||oo||oo|oo
||ooo|||ooo|||o|ooooo||||oo|||||oo||ooo|o||o||ooo|oo||oo|oo|||o|o|o|oooo|
|||oo|o||o||o|ooooooooo|o|o|||||oo|o||ooo|o||o|oo||||oo|o||o||o|ooo|||ooo
oooo|||ooooo||o||oo|ooo|||||o|oo|||o||o||ooo|ooo||oo||oo||o||o|oo|o|oo|||
oooooo||||oo|o||oo|||o|ooooo||ooo||||||oooo|||||oo||||ooo|||o|o|o|o||oooo
o|o|o|oo|o|oooo|o|ooo||oo|oo||||||||ooo|o||o||oo||o|||ooo|o||oo||oo||oo|o
oo||||oooooo|o||o|o|oooo||o|||oo|ooo|o|o|o|ooo||o|o|oo|o|||o|o|o|||o||o||
oo|oooo|oo|o|oo||||oo|||o||o|o||o||o|oooo|o||||o|o||o|ooooo||ooo||||||ooo
oo||o|oo||||oo|||||||||ooo|oo|||oo||oooo||o|o|o||||ooooooooo|oo|||oo|oo|o
o|o|||||o|o|||oo|oo|o|||o|o|||oo|oo||ooo|oo|oo||oooo||||o||||ooooooo||ooo
o|||||oo|o|||oo|ooooo|ooooo||o||oo||ooo||||oo|oooo||||oo|oooo||oo|o||||||
|oo|oo|||||oooooo||||ooo|||||ooo|oo|o|||oo|o|o|||o||ooo||ooo|o|oo|||o|ooo
ooooo|o|oo||o||||oo||oo|o|ooo||o|o|o|||ooo||||||o||oo|ooo||o|o||oo|o||ooo
|oo|ooooo||o||o|o|oo|oo|||ooo||||o|oo|oo|o||||o|oo|||o||o|||||ooooo|o|ooo
|o||ooooooo|||oo|ooo|ooo||||ooo||oo||ooo|||||||ooo|o|ooooo|||||o|o|o|||o|
9: デフォルトの名無しさん [sage] 2018/12/16(日) 21:10:16.93 ID:3q5iKhWM(1) AAS
こんなスレあったんだ
Windowsのフォントって、どのフォントがどのコード体系とか字体を使っている。
などを纏めているところってある??
10: デフォルトの名無しさん [sage] 2018/12/16(日) 23:11:32.43 ID:/e3hQGaS(1) AAS
ちょっと考えれば分かるようなことをなぜ聞くんだろう。
11: デフォルトの名無しさん [sage] 2018/12/17(月) 20:40:27.55 ID:kiEfSjeK(1) AAS
ちょっと考えれば解るなんてすごい人だな。
ちょっと書いてみ
12: デフォルトの名無しさん [] 2018/12/17(月) 21:18:18.25 ID:lO+98ZHR(1) AAS
あげ
13: デフォルトの名無しさん [] 2018/12/18(火) 03:08:10.44 ID:81OlOyOQ(1) AAS
nkf - Network Kanji Filter Fork
外部リンク:ja.osdn.net
v2.1.5
2018-12-15 18:19:02
14: デフォルトの名無しさん [] 2018/12/18(火) 11:22:36.98 ID:/M0/bFGF(1) AAS
>やはり頭悪いのはunicodeと符号化を混同してる

ここは同意

>2
2(1): デフォルトの名無しさん [sage] 2018/12/16(日) 12:40:36.99 ID:VlX3xGEw(2/7) AAS
■参考サイト
Unicode Home Page
外部リンク:www.unicode.org
Java Character Encodings
外部リンク:www.ingrid.org
euc.JP: tech docs, BeOS tools
外部リンク:euc.jp
IANA: Character Sets
外部リンク:www.iana.org
Legacy Encoding Project
外部リンク:sourceforge.jp
JIS X 4061
日本語文字列照合順番
外部リンク:www.jisc.go.jp
つ以上のオクテットを使う符号単位で
>BOM入れないヤツは池沼だからな

これは嘘
15: デフォルトの名無しさん [] 2018/12/19(水) 00:20:13.76 ID:jOXn0Ht9(1/5) AAS
低学歴知恵遅れには
エンディアンの概念がないのが
よおく分かったわ
16: デフォルトの名無しさん [sage] 2018/12/19(水) 00:28:37.33 ID:t+yG2AJO(1) AAS
CPUの内部形式とデータには何の関係もない
現にネットワークデータはCPUとは無関係の並びになってる
17: デフォルトの名無しさん [sage] 2018/12/19(水) 00:54:40.89 ID:s0UhV0Jg(1) AAS
やっぱあれ書いたの半角さんだったんだw
18: デフォルトの名無しさん [] 2018/12/19(水) 00:57:03.62 ID:jOXn0Ht9(2/5) AAS
うわあ。。。
マジでいってんの

こういうマジもんの低学歴がこの板で
はば利かせてるのがよく分かるわ

マジで頭悪いことを
ハジもなくなんの躊躇もなくいうからな

プログラムで
いちいエンディアン変換してんのすら
しらないらしいわ

当然Unicodeのエンコード方法にも
ビッグエディアンとリトルエンディアンがある
19: デフォルトの名無しさん [] 2018/12/19(水) 00:58:18.75 ID:jOXn0Ht9(3/5) AAS
もうね低学歴すぎてヤバイって
ちなみネットワークでデータを交換するときは
暗黙で基本はビッグエンディアンになってる

常識だからなコレ
20: デフォルトの名無しさん [] 2018/12/19(水) 01:00:17.18 ID:jOXn0Ht9(4/5) AAS
低学歴知恵遅れって
なんでものすごい頭悪いことを
自信満々にいうわけ?
21
(1): デフォルトの名無しさん [] 2018/12/19(水) 01:12:57.34 ID:jOXn0Ht9(5/5) AAS
ちなみipアドレスの並びはビックエンディアンになってる
ポート番号も当然ビックエンディアンになってる

ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ

ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる

ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる
22: デフォルトの名無しさん [sage] 2018/12/19(水) 01:39:07.45 ID:B2A2n/bL(1) AAS
半角カタカナはAAにしか見えない
23
(1): デフォルトの名無しさん [sage] 2018/12/19(水) 06:24:21.16 ID:wJcYDzdz(1) AAS
最近の子はバイトオーダーなんて意識しないからな
常識としては知っててほしいがけど
低レベルな処理書かなきゃ関係ないし触れることもないだろうから知らなくても困らんな
アラインメントとかパディングとかも同様
24
(1): デフォルトの名無しさん [sage] 2018/12/19(水) 12:49:47.13 ID:JIdS0sYR(1) AAS
エンディアン嘘つかない
25: デフォルトの名無しさん [] 2018/12/19(水) 16:46:27.07 ID:R6d6JT/9(1) AAS
>>23
バイトオーダーを意識する機会が減ったのは、xmlやjsonなどテキスト形式でデータ受け渡しすることが多くなったから。
テキスト形式ならバイトオーダーを意識せずに済むし、スクリプト言語で扱うのにも便利。
26: デフォルトの名無しさん [sage] 2018/12/19(水) 20:30:33.10 ID:gznchIbF(1) AAS
いやいや、テキストでもUTF16とかUTF32ならめっちゃ意識するやん。
27: ◆QZaw55cn4c [sage] 2018/12/19(水) 20:51:34.30 ID:C9bIO99C(1) AAS
>>24
豆知識、endian とは?
もともとは、卵を丸い方の端 (big end) から割る人々(Big Endians)と尖った方の端から割る人々 (Little Endians) との対立を表したものだった
28: デフォルトの名無しさん [sage] 2018/12/20(木) 01:35:41.75 ID:jYg2YnYV(1) AAS
そういえばハンプティダンプティの絵文字がない
29: デフォルトの名無しさん [sage] 2018/12/20(木) 03:36:13.08 ID:Epiz8Tj2(1/5) AAS
バイトオーダーやアラインメントは、C/C++以外の言語でバイナリデータを使おうとした時に強く意識することになる。
C/C++で開発している時はコンパイラが自動的に配置・取得してくれるデータを、スクリプト言語では自力でオフセット調整して配置・取得しなければならない。
C/C++より簡単なことが長所だったはずのC#・Java・Perl・Python言語などで、低レベルなオフセット調節を自力で行う必要に迫られる皮肉な状況が起きる。
30
(1): デフォルトの名無しさん [sage] 2018/12/20(木) 04:20:27.30 ID:ojhJ7lIE(1/3) AAS
> バイトオーダーやアラインメントは、C/C++以外の言語でバイナリデータを使おうとした時に強く意識することになる。
C/C++言語以外ではライブラリが処理してしまうんで意識しないかな
C/C++ライブラリを呼び出すライブラリを作るときは意識するだろうけど、
それって結局C/C++言語で書くんで、あれ?意識するのはC/C++かw
1-
あと 972 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.014s