[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
201: デフォルトの名無しさん [sage] 2021/09/24(金) 02:32:55.61 ID:LQ0rd/n8(1/4) AAS
>>194
194(2): ハノン ◆QZaw55cn4c [sage] 2021/09/23(木) 18:29:00.18 ID:HaJtCNmP(1) AAS
>>192
CJK 漢字統合の悪い後遺症なんですが、なんで CJK 漢字統合とかやってしまったの?
CJK別にすると16bitに収まらなかったから

けどそんなことはもう問題になってない
32bitで扱わないといけないのみんな知ってるし
外部表現はUTF-8だし
202: デフォルトの名無しさん [sage] 2021/09/24(金) 02:35:08.29 ID:LQ0rd/n8(2/4) AAS
>>195
195(1): デフォルトの名無しさん [sage] 2021/09/23(木) 20:01:43.64 ID:J2CwG+Vn(1) AAS
でも統合しなかったらしなかったで
「見た目同じだけど検索に引っかからない文字」
がOCRとか素人入力とかで大量に使われてそれはそれでアレだったんだろうなあ
そういう目的のためにCJK統合されたわけじゃない
だから役には立たない
そもそも新字旧字さえ同一文字とみなさないCJK統合文字の同一視を嬉しい奴なんか居ない
203: デフォルトの名無しさん [sage] 2021/09/24(金) 02:38:51.59 ID:LQ0rd/n8(3/4) AAS
>>200
200(1): デフォルトの名無しさん [] 2021/09/24(金) 01:03:35.59 ID:VG+rYv0i(1) AAS
ジャパニーズ絵文字をユニコードに入れまくったのは性犯罪と言える。
反省せよ!
世界統一基準のルールでやろうとすると実績ベースでやるしかない
Gmailの中の人が日本のキャリア携帯メールの絵文字対応する時に
Google独自の他社非互換の対応をするのではなくて標準に入れたのは英断
数千万人が使ってる文字の流通基盤作った
206: デフォルトの名無しさん [sage] 2021/09/24(金) 07:16:32.42 ID:LQ0rd/n8(4/4) AAS
>>205
205(1): デフォルトの名無しさん [sage] 2021/09/24(金) 04:21:14.03 ID:xJSRWXwX(2/3) AAS
Mecab用の新語辞書mecab-ipadic-NEologdの更新が2020年9月で止まってる
外部リンク:github.com
Twitterも止まってるな
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.049s