[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
647
(1): デフォルトの名無しさん [sage] 2022/10/11(火) 21:31:15.03 ID:OJo3NOQw(1/3) AAS
>>644
644(1): デフォルトの名無しさん [sage] 2022/10/11(火) 09:09:02.40 ID:Wi4OH2RZ(1/3) AAS
今から unicode を何とかするのなら完全 IVS化かなあ。
IVS の登録を全面拡大して、漢字を書く際には著者が使用した字体のIVSをつける。
IVSのついていない漢字は「著者が字体にこだわりは無く読者の好み字体で表示することを指定した」というルールにする。
字体にこだわるとテキストのサイズが増えるけど今の環境なら特に問題にはならないだろ。
たしかにそうすればCJK混在のテキストであっても、文字単位でそれぞれ正確に字体を表示できるね

ただし、そのままでは視覚的に「1. 完全IVS化仕様に基づいてIVSで修飾された漢字」と「2. 既存の個別コードポイントの漢字」の区別ができないが故に、テキスト作成時にIMEやエディタ側でその違いを視認できるような仕組みが必要になる気がする
それから、上記1,2双方の漢字を検索等で相互にマッチさせるにはUNICODE正規化仕様に手を入れればよいのだろうか?あまり詳しくないけど、その実現手段がない場合は色々とカオスな状況を招きそう

当たり前だけど、当該仕様を必要とする漢字圏のテキストサイズが倍近くなってしまう点もなかなかにキツい(それでも非漢字圏の言語に対する圧倒的な情報密度は揺るぎないが...)
649: デフォルトの名無しさん [sage] 2022/10/11(火) 23:13:45.33 ID:OJo3NOQw(2/3) AAS
>>64
64(1): デフォルトの名無しさん [sage] 2021/05/25(火) 14:38:56.72 ID:ZdUybFI8(1) AAS
そういえば、昔の*nixで日本語環境整えるのに、
このあたりが理解できないとまともな日本語表示すら出来なかったような
そのまま、とは?
650
(1): デフォルトの名無しさん [sage] 2022/10/11(火) 23:14:14.94 ID:OJo3NOQw(3/3) AAS
>>648
648(1): デフォルトの名無しさん [sage] 2022/10/11(火) 23:02:41.36 ID:Wi4OH2RZ(3/3) AAS
>>647
検索に関しては今の正規化検索が仕様通り実装されてれば、そのままでいけると思う。
安価ミス

そのまま、とは?
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.034s