[過去ログ] 文字コード総合スレ Part12 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
129: 127 [sage] 2019/01/21(月) 07:51:07.97 ID:uncS2Ppy(1) AAS
>>128
128(1): デフォルトの名無しさん [sage] 2019/01/20(日) 19:36:07.54 ID:GM/wkhUD(1) AAS
FFFC はオブジェクト用。変換のときに絵でも音楽でも写真でも、主に文字以外のものが埋め込まれていた場合用。
FFFD は文字用。変換のときに他の文字コードでは表現できる文字がユニコードでは表現できなかった場合用。
なるほど「オブジェクト」ってそういう意味か!
ありがとう。
つまり基本的に(Unicode環境で)「文字化け」した場合は
U+FFFCを目にすることはない訳だ。
(Webブラウザなら画像は別の形で表示されるし
端末なら8bitキャラクタの集合としてU+FFFDが使われるし)
359: デフォルトの名無しさん [sage] 2019/05/10(金) 00:24:53.97 ID:jEyv0NCa(1) AAS
つーかそろそろ日本工業規格も令和に対応すべきだと思うのだが。
JIX X 0213だけじゃなくてJIS X 0301とかも。
475: デフォルトの名無しさん [sage] 2019/06/14(金) 13:00:53.97 ID:AVMOMmmV(3/3) AAS
ごめん。誤り。MSwordは指定しない限り、合字にはならなかった。
516
(1): デフォルトの名無しさん [sage] 2019/07/13(土) 20:43:48.97 ID:tESkaNg7(1) AAS
����?
517: デフォルトの名無しさん [sage] 2019/07/13(土) 22:47:35.97 ID:0DH1k/wL(1) AAS
>>516
何これ?
619
(1): デフォルトの名無しさん [] 2019/09/01(日) 14:29:25.97 ID:k0czTyLP(3/3) AAS
>>618
618(1): デフォルトの名無しさん [sage] 2019/09/01(日) 14:17:44.56 ID:Cv4S4gQH(1/2) AAS
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。
851: デフォルトの名無しさん [] 2020/02/05(水) 16:28:36.97 ID:2rKdW1Ec(3/3) AAS
>>847
847(2): デフォルトの名無しさん [sage] 2020/02/05(水) 10:23:19.19 ID:MS9bo9CR(1/2) AAS
固定フォントのターミナルのような環境である文字のフォントの幅が全幅か半幅か判別する確実な方法ってありますか?
Unicode前提です
Unicode的にアジアンなんとかというドキュメントでそれに触れられているのを見つけましたが
結局のところ使用されているフォントで決まるような気がします
となるとCLIアプリが表示する前に判別する方法はないような
表示したあとならターミナルにカーソル位置問い合わせればわかりそうだと思いましたが
前にpythonで書いたときは
unicodedata.east_asian_width()
使ったと思う
Win32APIだと表示前に文字列全体の描画幅を求める方法があったと思う
907: デフォルトの名無しさん [] 2020/03/09(月) 17:52:27.97 ID:T4gz2l9R(1) AAS
>>903
903(1): デフォルトの名無しさん [sage] 2020/03/09(月) 05:26:10.28 ID:z9inAChS(1) AAS
(0)とか黒丸の小文字英字とか白丸のンとか黒丸の仮名とかは
Unicodeですら未だに無いんだよな...
◎と字形が同じとかで一緒にされそう

あと将棋の駒(上下とか白黒)も欲しいとか言ってた人?
950: デフォルトの名無しさん [sage] 2020/06/22(月) 20:41:37.97 ID:NxxL+RwQ(1) AAS
発端は>>891
891(2): デフォルトの名無しさん [sage] 2020/02/21(金) 14:33:03.02 ID:MAyK0RyJ(1) AAS
Twitterリンク:akinomyoga

修正の入った Cygwin 3.1.4 のリリースノートが来て、見てみたら @cjksingle という不穏な locale が発明されてる。
何かと思ったら「CJK文字も全て半角にすれば文字幅問題解決じゃん」という欧米人(東欧系?)の思いつきで、これは新しい悪夢なのでは…。mintty は仕事が早すぎ
外部リンク:gitlab.freedesktop.org

因みにこの東欧人を追うともっと面白い(?)ものが。。漢字や絵文字が行末に収まらない時は左半分はその行に右半分は次の行に表示するのが合理的だと Windows Terminal に赴いて主張してる。
曰く、殆どの漢字は偏(へん)と旁(つくり)から成るので分断しても意味を失わないとか…
外部リンク:github.com
Twitterリンク:5chan_nel (5ch newer account)
だろう
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.034s