[過去ログ]
文字コード総合スレ Part12 (1002レス)
文字コード総合スレ Part12 http://mevius.5ch.net/test/read.cgi/tech/1544931495/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
76: デフォルトの名無しさん [sage] 2019/01/02(水) 11:30:40.86 ID:6YX6jwF2 新元号『』 http://mevius.5ch.net/test/read.cgi/tech/1544931495/76
77: デフォルトの名無しさん [sage] 2019/01/02(水) 22:33:06.92 ID:Fz1uszjs 新元号が分からなくてグリフが間に合わないからUnicode 12.1を出すってのは仕方ないけど 新元号の組字のためだけにAdobeJapan1を改訂するってのは馬鹿げてる http://mevius.5ch.net/test/read.cgi/tech/1544931495/77
78: デフォルトの名無しさん [sage] 2019/01/03(木) 00:28:36.38 ID:agNiXwq6 元号は安晋に内定してるだろ http://mevius.5ch.net/test/read.cgi/tech/1544931495/78
79: デフォルトの名無しさん [sage] 2019/01/03(木) 09:15:51.35 ID:IESB6EpY MS-DOS でのプログラミングではメモリ内の特定のバイトについて 文字の中の何バイト目かを 1 バイトずつ遡って調べるということも あったようだけど自分ではそういうコードを書いた記憶がない。 いや、もしかしたらあったのかもしれないけど。 EUC-JP の場合は ASCII なバイトかシングルシフトが現れた時点で 確定するようだけど。Unicode の時代になって良かったね。 まあ、そんなようなことを今更思った。あけましておめでとう。 http://mevius.5ch.net/test/read.cgi/
tech/1544931495/79
80: デフォルトの名無しさん [sage] 2019/01/03(木) 21:04:56.87 ID:ejflNGhp >>72 ありがとう。 なにか事情があったんだろうけど、なんだろうね……。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/80
81: デフォルトの名無しさん [sage] 2019/01/04(金) 13:59:50.88 ID:8DNHKlb4 あけおめ >>79 大昔のことだけど、SJIS 文字列の末尾から検索するプログラム書いてた時は「SJIS、お前はマジで殺す」という気持ちで一杯でした。 もう二度とあんなことはやりたくない。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/81
82: 79 [sage] 2019/01/04(金) 17:36:17.24 ID:opswFKCW ありがとう、まさにそういうことです。 p=strchr( path,'\\'); /* おい *p 、お前は本当に '\\' なのか? 表とかじゃないのか? */ http://mevius.5ch.net/test/read.cgi/tech/1544931495/82
83: デフォルトの名無しさん [sage] 2019/01/04(金) 18:54:02.55 ID:3Gm4cMvD Windows環境ならそこは _mbschr() でしょ。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/83
84: デフォルトの名無しさん [sage] 2019/01/04(金) 19:30:16.38 ID:EMYjNY+E UnicodeはSJISよりも扱いが複雑だけど ライブラリが揃ってるからねー 一文字が1バイトだろうと3バイトだろうと 2文字で1文字を表していようが、簡単に一文字判定ができちゃう http://mevius.5ch.net/test/read.cgi/tech/1544931495/84
85: デフォルトの名無しさん [sage] 2019/01/04(金) 21:30:36.38 ID:atCGQoq2 複数コードポイントで1文字を表すのって上限って決まってないの?青天井? http://mevius.5ch.net/test/read.cgi/tech/1544931495/85
86: デフォルトの名無しさん [sage] 2019/01/04(金) 22:02:58.14 ID:rG/yv5Zr UTF-8なら、最大四バイトだけど、そういうことじゃなくて? http://mevius.5ch.net/test/read.cgi/tech/1544931495/86
87: デフォルトの名無しさん [sage] 2019/01/04(金) 22:11:30.43 ID:FtJLKwOD >>86 先ずコードポイントの意味を理解してから質問した方が良い http://mevius.5ch.net/test/read.cgi/tech/1544931495/87
88: デフォルトの名無しさん [sage] 2019/01/04(金) 22:27:33.32 ID:atCGQoq2 なんかごめん http://mevius.5ch.net/test/read.cgi/tech/1544931495/88
89: デフォルトの名無しさん [sage] 2019/01/04(金) 23:45:49.70 ID:EMYjNY+E >>86 最大4バイトじゃないよ 漢字1文字が最大8バイト、Unicodeの「IVS」とは? https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/ Unicodeは複雑過ぎてライブラリを使わないと正しく扱うのはまず無理 もし自力で文字数をカウントしたいならこれとか読んで頑張れ https://www.kthree.co.jp/kihelp/index.html?page=data/ivs&type=html http://mevius.5ch.net/test/read.cgi/tech/1544931495/89
90: デフォルトの名無しさん [sage] 2019/01/04(金) 23:54:23.74 ID:EMYjNY+E ZWJシーケンス というのもあるね https://qiita.com/nonanona/items/b148c212ba7c24942e93#%E7%B5%B5%E6%96%87%E5%AD%97%E7%94%A8%E3%81%AE%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BFemoji-variation-selector%E3%81%A8%E3%81%AF 見た目上は1文字なのに例えば U+1F468 U+200D U+1F3A8 みたいに3文字になる。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/90
91: デフォルトの名無しさん [sage] 2019/01/05(土) 00:00:08.40 ID:41KVD0qa https://unicode.org/emoji/charts/emoji-zwj-sequences.html#1f441_fe0f_200d_1f5e8_fe0f 酷いねー。見た目上は1文字なのにU+1F441 U+FE0F U+200D U+1F5E8 U+FE0F と5文字分使ってる バイト数だと17バイトみたいね http://mevius.5ch.net/test/read.cgi/tech/1544931495/91
92: デフォルトの名無しさん [sage] 2019/01/05(土) 00:03:32.79 ID:fLBZxFEd 合成文字・絵文字とかが絡むともっと地獄になるけどな http://tech.albert2005.co.jp/201/ https://qiita.com/nonanona/items/b148c212ba7c24942e93 http://mevius.5ch.net/test/read.cgi/tech/1544931495/92
93: デフォルトの名無しさん [sage] 2019/01/05(土) 00:03:39.55 ID:41KVD0qa ZWJを使うと最大11文字だって。 https://n2p.co.jp/blog/column/counting-characters-on-twitter/ http://mevius.5ch.net/test/read.cgi/tech/1544931495/93
94: デフォルトの名無しさん [sage] 2019/01/05(土) 00:07:24.29 ID:41KVD0qa Unicodeは1文字の概念も破綻しちゃったね 1文字に見えるやろ?でもこれは11文字なんや 全く意味がわからないw http://mevius.5ch.net/test/read.cgi/tech/1544931495/94
95: デフォルトの名無しさん [sage] 2019/01/05(土) 00:11:16.35 ID:41KVD0qa 見た目上の1文字は最大4バイト×11文字で44バイトなのかな?w 11文字ってのは今現在存在する最大が11文字ってだけで青天井? もうライブラリ使ってないと無理だね http://mevius.5ch.net/test/read.cgi/tech/1544931495/95
96: ◆QZaw55cn4c [sage] 2019/01/05(土) 00:12:47.39 ID:F8+3E8Pf 世の中にあるすべての文字をコード化してやる! という意義には賛同していたんですけれども、(主に経済的理由により)絵文字が入った時点で失望してしまいました… 仕切りなおしたほうがいいんじゃないですか? http://mevius.5ch.net/test/read.cgi/tech/1544931495/96
97: デフォルトの名無しさん [sage] 2019/01/05(土) 00:38:07.30 ID:198zQJKz 仕切りなおしてもBCで絵文字は入ります。 というかもはや絵文字は世界中のスマホ/SNSユーザーに愛用されています。 ここまでくるともはや後戻りはできないのです。 http://mevius.5ch.net/test/read.cgi/tech/1544931495/97
98: デフォルトの名無しさん [sage] 2019/01/05(土) 00:46:41.68 ID:fLBZxFEd 仕切りなおすどころかUnicodeの規格がさらに拡張されて状況悪化するんだろうなあ Unicode12も来年・・・じゃないやもう今年リリースされる予定のはずだし http://mevius.5ch.net/test/read.cgi/tech/1544931495/98
99: デフォルトの名無しさん [sage] 2019/01/05(土) 01:28:42.81 ID:41KVD0qa 絵文字は象形文字の発展版なんだから 文字扱いするのは当然 http://mevius.5ch.net/test/read.cgi/tech/1544931495/99
100: デフォルトの名無しさん [sage] 2019/01/05(土) 12:51:39.06 ID:l3tIMYns 現代の文字は自然発生するわけでも王朝が発布するわけでもなくユニコードコンソーシアムが追加するのだ http://mevius.5ch.net/test/read.cgi/tech/1544931495/100
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 902 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.010s