[過去ログ] 文字コード総合スレ Part12 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
71: デフォルトの名無しさん [sage] 2018/12/31(月) 08:52:03.67 ID:Tj5kujd4(1) AAS
C1制御文字の<128>って多くの文字コードで「PAD」と名付けられているのに
UnicodeでのU+0080はxxxみたいに無名なのって理由ある?
72(1): デフォルトの名無しさん [sage] 2018/12/31(月) 13:29:33.60 ID:8Z6ezMyM(1) AAS
U+0080,U+0081,U+0084,U+0099は、ISO6429/ECMA-48で制御文字に含まれていない
というか削除されてる
外部リンク[htm]:www.ecma-international.org
外部リンク[pdf]:www.ecma-international.org
WikipediaソースによるとUnicode初期ドラフトにはU+0080も入っていたみたいなことも書かれてるね
外部リンク:en.wikipedia.org
73: デフォルトの名無しさん [sage] 2019/01/01(火) 01:45:48.02 ID:kXQfWbAp(1) AAS
なんてこった
エイプリルフールだって?
74: デフォルトの名無しさん [sage] 2019/01/01(火) 23:58:04.80 ID:j16q/z48(1) AAS
あけましておめでとうございます
2019年は何が起きるかしらね
75: デフォルトの名無しさん [sage] 2019/01/02(水) 00:20:17.09 ID:R6tFufwf(1) AAS
エイプリルフールはまだだけど元号ネタとかあるだろうな
新元号『NEO平成』に決定みたいな
76: デフォルトの名無しさん [sage] 2019/01/02(水) 11:30:40.86 ID:6YX6jwF2(1) AAS
新元号『』
77: デフォルトの名無しさん [sage] 2019/01/02(水) 22:33:06.92 ID:Fz1uszjs(1) AAS
新元号が分からなくてグリフが間に合わないからUnicode 12.1を出すってのは仕方ないけど
新元号の組字のためだけにAdobeJapan1を改訂するってのは馬鹿げてる
78: デフォルトの名無しさん [sage] 2019/01/03(木) 00:28:36.38 ID:agNiXwq6(1) AAS
元号は安晋に内定してるだろ
79(2): デフォルトの名無しさん [sage] 2019/01/03(木) 09:15:51.35 ID:IESB6EpY(1) AAS
MS-DOS でのプログラミングではメモリ内の特定のバイトについて
文字の中の何バイト目かを 1 バイトずつ遡って調べるということも
あったようだけど自分ではそういうコードを書いた記憶がない。
いや、もしかしたらあったのかもしれないけど。
EUC-JP の場合は ASCII なバイトかシングルシフトが現れた時点で
確定するようだけど。Unicode の時代になって良かったね。
まあ、そんなようなことを今更思った。あけましておめでとう。
80: デフォルトの名無しさん [sage] 2019/01/03(木) 21:04:56.87 ID:ejflNGhp(1) AAS
>>72
ありがとう。
なにか事情があったんだろうけど、なんだろうね……。
81: デフォルトの名無しさん [sage] 2019/01/04(金) 13:59:50.88 ID:8DNHKlb4(1) AAS
あけおめ
>>79
大昔のことだけど、SJIS 文字列の末尾から検索するプログラム書いてた時は「SJIS、お前はマジで殺す」という気持ちで一杯でした。
もう二度とあんなことはやりたくない。
82: 79 [sage] 2019/01/04(金) 17:36:17.24 ID:opswFKCW(1) AAS
ありがとう、まさにそういうことです。
p=strchr( path,'\\'); /* おい *p 、お前は本当に '\\' なのか? 表とかじゃないのか? */
83: デフォルトの名無しさん [sage] 2019/01/04(金) 18:54:02.55 ID:3Gm4cMvD(1) AAS
Windows環境ならそこは _mbschr() でしょ。
84: デフォルトの名無しさん [sage] 2019/01/04(金) 19:30:16.38 ID:EMYjNY+E(1/3) AAS
UnicodeはSJISよりも扱いが複雑だけど
ライブラリが揃ってるからねー
一文字が1バイトだろうと3バイトだろうと
2文字で1文字を表していようが、簡単に一文字判定ができちゃう
85: デフォルトの名無しさん [sage] 2019/01/04(金) 21:30:36.38 ID:atCGQoq2(1/2) AAS
複数コードポイントで1文字を表すのって上限って決まってないの?青天井?
86(2): デフォルトの名無しさん [sage] 2019/01/04(金) 22:02:58.14 ID:rG/yv5Zr(1) AAS
UTF-8なら、最大四バイトだけど、そういうことじゃなくて?
87: デフォルトの名無しさん [sage] 2019/01/04(金) 22:11:30.43 ID:FtJLKwOD(1) AAS
>>86
先ずコードポイントの意味を理解してから質問した方が良い
88: デフォルトの名無しさん [sage] 2019/01/04(金) 22:27:33.32 ID:atCGQoq2(2/2) AAS
なんかごめん
89: デフォルトの名無しさん [sage] 2019/01/04(金) 23:45:49.70 ID:EMYjNY+E(2/3) AAS
>>86
最大4バイトじゃないよ
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
外部リンク:tech.nikkeibp.co.jp
Unicodeは複雑過ぎてライブラリを使わないと正しく扱うのはまず無理
もし自力で文字数をカウントしたいならこれとか読んで頑張れ
外部リンク[html]:www.kthree.co.jp
90: デフォルトの名無しさん [sage] 2019/01/04(金) 23:54:23.74 ID:EMYjNY+E(3/3) AAS
ZWJシーケンス というのもあるね
外部リンク:qiita.com
見た目上は1文字なのに例えば U+1F468 U+200D U+1F3A8 みたいに3文字になる。
91: デフォルトの名無しさん [sage] 2019/01/05(土) 00:00:08.40 ID:41KVD0qa(1/6) AAS
外部リンク[html]:unicode.org
酷いねー。見た目上は1文字なのにU+1F441 U+FE0F U+200D U+1F5E8 U+FE0F と5文字分使ってる
バイト数だと17バイトみたいね
92: デフォルトの名無しさん [sage] 2019/01/05(土) 00:03:32.79 ID:fLBZxFEd(1/2) AAS
合成文字・絵文字とかが絡むともっと地獄になるけどな
外部リンク:tech.albert2005.co.jp
外部リンク:qiita.com
93: デフォルトの名無しさん [sage] 2019/01/05(土) 00:03:39.55 ID:41KVD0qa(2/6) AAS
ZWJを使うと最大11文字だって。
外部リンク:n2p.co.jp
94: デフォルトの名無しさん [sage] 2019/01/05(土) 00:07:24.29 ID:41KVD0qa(3/6) AAS
Unicodeは1文字の概念も破綻しちゃったね
1文字に見えるやろ?でもこれは11文字なんや
全く意味がわからないw
95: デフォルトの名無しさん [sage] 2019/01/05(土) 00:11:16.35 ID:41KVD0qa(4/6) AAS
見た目上の1文字は最大4バイト×11文字で44バイトなのかな?w
11文字ってのは今現在存在する最大が11文字ってだけで青天井?
もうライブラリ使ってないと無理だね
上下前次1-新書関写板覧索設栞歴
あと 907 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.023s