[過去ログ] 文字コード総合スレ Part11 (1002レス)
上下前次1-新
抽出解除 レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
25: デフォルトの名無しさん [sage] 2018/02/01(木) 12:26:52.61 ID:ypQwObPk(1) AAS
OS標準のフォントに変体仮名が入るのはまだ先の話かな。
91: デフォルトの名無しさん [sage] 2018/03/09(金) 21:41:02.61 ID:F3m2Keu8(1) AAS
教育漢字(小学校で習う漢字)しか入ってないお試しフォントを時々見かけるけど
外部リンク[html]:forest.watch.impress.co.jp
こういうフォントはインスコしたらそこそこ役に立つんだろうか?
人名は色々引っかかるから名簿には使えないだろうけど
224(1): デフォルトの名無しさん [] 2018/05/04(金) 02:22:41.61 ID:hkSS9FCA(1/3) AAS
1文字単位で半角幅化できれば合字いらなくなるでしょ。
225: デフォルトの名無しさん [] 2018/05/04(金) 02:36:16.61 ID:9i+OMC2T(1) AAS
峠か
235(1): デフォルトの名無しさん [] 2018/05/05(土) 09:14:26.61 AAS
これでその時点の元号を表示すればいいのか
<日本の元号を表すコード(共通)> <西暦年(100の位 : 6〜20)を表す制御コード> <西暦年(0〜99)を表す制御コード> <月(1〜12)を表す制御コード> <日(1〜31)を表す制御コード>
339: デフォルトの名無しさん [] 2018/05/31(木) 12:04:29.61 AAS
ケチ付けるんなら他人を納得させられる論拠と出典を出せよ
それができないんなら『CJK互換文字の利用は「推奨しない」』が正解だ
361: デフォルトの名無しさん [sage] 2018/06/04(月) 17:00:48.61 ID:pTAw0294(1) AAS
>>342342(2): デフォルトの名無しさん [sage] 2018/05/31(木) 23:08:01.93 ID:CO1u2co/(1) AAS
>>319のリンク先の規格書で、ラウンドトリップ用だから使用を推奨しないとされているのは以下の3種類だけ。
全体を非推奨とはしていないな。
・U+FA30〜U+FA6A (JIS X 0213:2000)
・U+FA6B〜U+FA6D (ARIB STD-B24)
・U+FA70〜U+FAD9 (KPS 10721-2000)
マジか、マジだ
つまり最初に入ったKS X 1001/Big5/IBMは仕様書上では何も言われてなくて
後から入ったJIS X 0213とかは「ラウンドトリップ以外の使用は推奨しない」と明記なのか。
こんなことならJIS X 0213も無理してBMPに入れずにCNS 11643の残りと一緒にCJK統合漢字拡張Bに入れてもらえばよかったのに
(それが可能だったのかどうかは知らない)。
393: デフォルトの名無しさん [sage] 2018/06/18(月) 16:14:38.61 ID:q6319o4n(1) AAS
std::wstringがデフォルトでUTF-32になるLinux 64bit版のSTLにも同じこと言えんの?
419: デフォルトの名無しさん [] 2018/06/21(木) 09:07:52.61 ID:y5k3a+mj(1) AAS
MACみたいにCRだけっていうのは病気だけど
CR+LFが来たら常にCR無視しておけばいいし
自分で出力するときはLFだけ出力しておけばいい
それだけ
505: デフォルトの名無しさん [sage] 2018/07/06(金) 22:30:52.61 ID:p79Hvr/2(1) AAS
先月のWG2ロンドン会議で32ffが予約された
>>501申請者に権利なんてないよ。英文ができてフォントが作れるなら誰でも提案できる
646: デフォルトの名無しさん [sage] 2018/08/11(土) 13:16:33.61 ID:uKNQsIii(1) AAS
>>644644(1): デフォルトの名無しさん [sage] 2018/08/11(土) 11:30:16.03 ID:dFDFw6X4(1) AAS
何年か前に、地域の緊急速報のテストメールか何かに
エンコーディングを混在させて文字化けを地域住民に送って混乱させたのあったな
メールテンプレートのエンコーディングと、流し込む本文で混在させちゃったみたいな
去年だぞ
703: デフォルトの名無しさん [sage] 2018/08/16(木) 10:25:22.61 ID:Lp1O0T8c(1) AAS
>>701701(1): デフォルトの名無しさん [sage] 2018/08/16(木) 08:19:53.82 ID:RvAH1val(1/2) AAS
ファイルシステムに記録された物理的encodingに依存したコーディングができる方が良いという主張かねぇ。
内部ネイティブ文字コードがcharになっているLinux/Unixでは
char非互換の文字コードに対応するのが大変だったという主張
>>702702(1): デフォルトの名無しさん [sage] 2018/08/16(木) 08:31:16.13 ID:FM/GQ3/9(1) AAS
Windows標準のXmlLiteというXMLパーサーは、入力ファイルがどんな文字エンコードだろうと、
UTF16に適宜変換するようになっているので、プログラマに読み取り時の文字エンコード選択の余地はない。
Windowsは内部ネイティブ文字コードがUnicode(UTF-16)だから
別にそれでいいのでは?
それにしても結果論ではあるけど、wchar_tは失敗だったねぇ
16bitでは足りないことは最初からわかっていたけど、たとえ32bitであっても
異字体セレクタやらで意味的な1文字のbit数が固定ではなくなってしまった。
固定でないならば単純な実装で文字を扱うのは不可能。
whar_t使うメリットが無くなってしまった。
まあその怪我の功名で絵文字に色がつけられるようになり、肌色の違いも
対応も可能になったんだけど、これも良かったんだか悪かったんだが。
ここまで来たら絵文字以外の文字も全て色変化対応にしたらって思う
そうすりゃエスケープシーケンスなしで色を付けられるよ
もはや文字コードじゃないね
813(1): デフォルトの名無しさん [sage] 2018/09/21(金) 08:54:48.61 ID:YSf5+rmt(1) AAS
>>811811(2): デフォルトの名無しさん [sage] 2018/09/21(金) 03:58:13.13 ID:dtC8HZuo(1/2) AAS
すいません
「�����������d」
という文字列を解読したいです。
$ echo '<当該文字列>' | od -A xn -t x1
の結果は
000000 ef bf bd ef bf bd ef bf bd ef bf bd ef bf bd ef
000010 bf bd ef bf bd ef bf bd ef bf bd ef bf bd ef bf
000020 bd 64
のような感じです。
個人的には\0x0eや\0x0fが多く登場しているのでUTF-16あたりをUTF-8で解釈しているのかなとも思いまして
iconv(1)などでどうにかしようとしました(iconv -c -f utf16 -t utf8)が 駄目でした。
どうかよろしくおねがいします。
utf8のEF BF BDは、utf16ではFFFD(非文字)。
例えば、エンコードに失敗した時に使われる。
844: デフォルトの名無しさん [sage] 2018/10/09(火) 21:29:38.61 ID:cJ7fFqob(1) AAS
最近またUnicodeが分からなくなってしまった。
単にShift_JISのような
「一部コードを拡張マップ専用の文字にして後続のコードを
その拡張マップ専用の文字のコードと連続した(つまり2次元的な配置の)コードとして
処理する」
っていう方法ではないのか。
952: デフォルトの名無しさん [] 2018/12/07(金) 22:28:33.61 ID:Z7Pkiqbl(1) AAS
しかし年号の余裕も言うほどないよな
10人くらいがばばーっと毎年のように亡くなって年号も変わったらどうするつもりなのだろう
なんだかんだで西暦が一番よねえ
もしくはネトウヨが言うような皇紀とやらにしちゃいなよ
人で変わらない数字って楽ちんよー
四桁にもなれば先頭はまず変わらないわけだし
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.053s