[過去ログ] 文字コード総合スレ Part12 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
76: デフォルトの名無しさん [sage] 2019/01/02(水) 11:30:40.86 ID:6YX6jwF2(1) AAS
新元号『』
77: デフォルトの名無しさん [sage] 2019/01/02(水) 22:33:06.92 ID:Fz1uszjs(1) AAS
新元号が分からなくてグリフが間に合わないからUnicode 12.1を出すってのは仕方ないけど
新元号の組字のためだけにAdobeJapan1を改訂するってのは馬鹿げてる
78: デフォルトの名無しさん [sage] 2019/01/03(木) 00:28:36.38 ID:agNiXwq6(1) AAS
元号は安晋に内定してるだろ
79(2): デフォルトの名無しさん [sage] 2019/01/03(木) 09:15:51.35 ID:IESB6EpY(1) AAS
MS-DOS でのプログラミングではメモリ内の特定のバイトについて
文字の中の何バイト目かを 1 バイトずつ遡って調べるということも
あったようだけど自分ではそういうコードを書いた記憶がない。
いや、もしかしたらあったのかもしれないけど。
EUC-JP の場合は ASCII なバイトかシングルシフトが現れた時点で
確定するようだけど。Unicode の時代になって良かったね。
まあ、そんなようなことを今更思った。あけましておめでとう。
80: デフォルトの名無しさん [sage] 2019/01/03(木) 21:04:56.87 ID:ejflNGhp(1) AAS
>>72ありがとう。
なにか事情があったんだろうけど、なんだろうね……。
81: デフォルトの名無しさん [sage] 2019/01/04(金) 13:59:50.88 ID:8DNHKlb4(1) AAS
あけおめ
>>79
大昔のことだけど、SJIS 文字列の末尾から検索するプログラム書いてた時は「SJIS、お前はマジで殺す」という気持ちで一杯でした。
もう二度とあんなことはやりたくない。
82: 79 [sage] 2019/01/04(金) 17:36:17.24 ID:opswFKCW(1) AAS
ありがとう、まさにそういうことです。
p=strchr( path,'\\'); /* おい *p 、お前は本当に '\\' なのか? 表とかじゃないのか? */
83: デフォルトの名無しさん [sage] 2019/01/04(金) 18:54:02.55 ID:3Gm4cMvD(1) AAS
Windows環境ならそこは _mbschr() でしょ。
84: デフォルトの名無しさん [sage] 2019/01/04(金) 19:30:16.38 ID:EMYjNY+E(1/3) AAS
UnicodeはSJISよりも扱いが複雑だけど
ライブラリが揃ってるからねー
一文字が1バイトだろうと3バイトだろうと
2文字で1文字を表していようが、簡単に一文字判定ができちゃう
85: デフォルトの名無しさん [sage] 2019/01/04(金) 21:30:36.38 ID:atCGQoq2(1/2) AAS
複数コードポイントで1文字を表すのって上限って決まってないの?青天井?
86(2): デフォルトの名無しさん [sage] 2019/01/04(金) 22:02:58.14 ID:rG/yv5Zr(1) AAS
UTF-8なら、最大四バイトだけど、そういうことじゃなくて?
87: デフォルトの名無しさん [sage] 2019/01/04(金) 22:11:30.43 ID:FtJLKwOD(1) AAS
>>86
先ずコードポイントの意味を理解してから質問した方が良い
88: デフォルトの名無しさん [sage] 2019/01/04(金) 22:27:33.32 ID:atCGQoq2(2/2) AAS
なんかごめん
89: デフォルトの名無しさん [sage] 2019/01/04(金) 23:45:49.70 ID:EMYjNY+E(2/3) AAS
>>86
最大4バイトじゃないよ
漢字1文字が最大8バイト、Unicodeの「IVS」とは?
外部リンク:tech.nikkeibp.co.jp
Unicodeは複雑過ぎてライブラリを使わないと正しく扱うのはまず無理
もし自力で文字数をカウントしたいならこれとか読んで頑張れ
外部リンク[html]:www.kthree.co.jp
90: デフォルトの名無しさん [sage] 2019/01/04(金) 23:54:23.74 ID:EMYjNY+E(3/3) AAS
ZWJシーケンス というのもあるね
外部リンク:qiita.com
見た目上は1文字なのに例えば U+1F468 U+200D U+1F3A8 みたいに3文字になる。
91: デフォルトの名無しさん [sage] 2019/01/05(土) 00:00:08.40 ID:41KVD0qa(1/6) AAS
外部リンク[html]:unicode.org
酷いねー。見た目上は1文字なのにU+1F441 U+FE0F U+200D U+1F5E8 U+FE0F と5文字分使ってる
バイト数だと17バイトみたいね
92: デフォルトの名無しさん [sage] 2019/01/05(土) 00:03:32.79 ID:fLBZxFEd(1/2) AAS
合成文字・絵文字とかが絡むともっと地獄になるけどな
外部リンク:tech.albert2005.co.jp
外部リンク:qiita.com
93: デフォルトの名無しさん [sage] 2019/01/05(土) 00:03:39.55 ID:41KVD0qa(2/6) AAS
ZWJを使うと最大11文字だって。
外部リンク:n2p.co.jp
94: デフォルトの名無しさん [sage] 2019/01/05(土) 00:07:24.29 ID:41KVD0qa(3/6) AAS
Unicodeは1文字の概念も破綻しちゃったね
1文字に見えるやろ?でもこれは11文字なんや
全く意味がわからないw
95: デフォルトの名無しさん [sage] 2019/01/05(土) 00:11:16.35 ID:41KVD0qa(4/6) AAS
見た目上の1文字は最大4バイト×11文字で44バイトなのかな?w
11文字ってのは今現在存在する最大が11文字ってだけで青天井?
もうライブラリ使ってないと無理だね
96: ◆QZaw55cn4c [sage] 2019/01/05(土) 00:12:47.39 ID:F8+3E8Pf(1/2) AAS
世の中にあるすべての文字をコード化してやる!
という意義には賛同していたんですけれども、(主に経済的理由により)絵文字が入った時点で失望してしまいました…
仕切りなおしたほうがいいんじゃないですか?
97(3): デフォルトの名無しさん [sage] 2019/01/05(土) 00:38:07.30 ID:198zQJKz(1) AAS
仕切りなおしてもBCで絵文字は入ります。
というかもはや絵文字は世界中のスマホ/SNSユーザーに愛用されています。
ここまでくるともはや後戻りはできないのです。
98: デフォルトの名無しさん [sage] 2019/01/05(土) 00:46:41.68 ID:fLBZxFEd(2/2) AAS
仕切りなおすどころかUnicodeの規格がさらに拡張されて状況悪化するんだろうなあ
Unicode12も来年・・・じゃないやもう今年リリースされる予定のはずだし
99(1): デフォルトの名無しさん [sage] 2019/01/05(土) 01:28:42.81 ID:41KVD0qa(5/6) AAS
絵文字は象形文字の発展版なんだから
文字扱いするのは当然
100: デフォルトの名無しさん [sage] 2019/01/05(土) 12:51:39.06 ID:l3tIMYns(1) AAS
現代の文字は自然発生するわけでも王朝が発布するわけでもなくユニコードコンソーシアムが追加するのだ
上下前次1-新書関写板覧索設栞歴
あと 902 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.013s