[過去ログ] 文字コード総合スレ Part12 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
3: デフォルトの名無しさん [sage] 2018/12/16(日) 12:45:08.07 ID:VlX3xGEw(3/7) AAS
■これまでに行われた議論
・Windows 10のコマンドプロンプトでUTF-8を使用する場合chcp 65001で切替可能。日本語入力等も可
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。Unicodeでは機種依存文字ではない。
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → 対応済み
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・Unicodeのzipが文字化けする。→Windows 7は公式パッチで対応可能。8以降は標準対応
5: デフォルトの名無しさん [sage] 2018/12/16(日) 12:46:16.07 ID:VlX3xGEw(5/7) AAS
もうひとつの過去スレ:
文字コード統一スレ 1文字目
2chスレ:tech

隔離スレ:
UnicodeとUTF-8の違いは?
2chスレ:tech
UnicodeとUTF-8の違いは? その2
2chスレ:tech
UnicodeとUTF-8の違いは? その2
2chスレ:tech
UnicodeとUTF-8の違い4(インディアン隔離スレ)
2chスレ:tech
25: デフォルトの名無しさん [] 2018/12/19(水) 16:46:27.07 ID:R6d6JT/9(1) AAS
>>23
23(1): デフォルトの名無しさん [sage] 2018/12/19(水) 06:24:21.16 ID:wJcYDzdz(1) AAS
最近の子はバイトオーダーなんて意識しないからな
常識としては知っててほしいがけど
低レベルな処理書かなきゃ関係ないし触れることもないだろうから知らなくても困らんな
アラインメントとかパディングとかも同様
バイトオーダーを意識する機会が減ったのは、xmlやjsonなどテキスト形式でデータ受け渡しすることが多くなったから。
テキスト形式ならバイトオーダーを意識せずに済むし、スクリプト言語で扱うのにも便利。
145: デフォルトの名無しさん [sage] 2019/01/24(木) 14:09:11.07 ID:CmuJPGgn(1/2) AAS
>>142
142(1): デフォルトの名無しさん [sage] 2019/01/23(水) 20:08:35.75 ID:9uGbsXCn(1) AAS
>>141
文字がないのに文字コード化できるの?
俺に言うな。>>138
138(4): デフォルトの名無しさん [sage] 2019/01/22(火) 23:10:13.56 ID:MZI8yiK5(1) AAS
>>133
より正確に言えば、
保存するときにローカルの文字コードに変換してるソフトかもしれないのでそのソフトの仕様による
例えば英文フォントしかないPCだと漢字は表示できないだろうから表示できるかどうかは環境による
だろう

>>131
あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理だと思うがなあ
に家
縄文時代の日本語を混在できないとしたら、
それは例えば「文字がない」ことなのに、
Unicodeだから無理みたいな言い方してるんだから
213: デフォルトの名無しさん [] 2019/03/09(土) 00:06:34.07 ID:bJz0o3uK(1) AAS
私用領域U+E50Aが渋谷109の絵文字に割り当てられているツイッターさんの前でも同じこと言えんの?
Twitterリンク:muota_here
Twitterリンク:5chan_nel (5ch newer account)
616
(1): デフォルトの名無しさん [] 2019/09/01(日) 13:42:43.07 ID:k0czTyLP(2/3) AAS
>>612
612(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:07:58.05 ID:lmQdJ5gb(1) AAS
>>611
いろいろ間違ってるなw

まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる

あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。

>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。

シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。

>UTF32が21bitコードになってしまったのはUTF-8のせいだ

UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。

>21
21(1): デフォルトの名無しさん [] 2018/12/19(水) 01:12:57.34 ID:jOXn0Ht9(5/5) AAS
ちなみipアドレスの並びはビックエンディアンになってる
ポート番号も当然ビックエンディアンになってる

ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ

ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる

ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる
bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。

>>613
613(1): デフォルトの名無しさん [sage] 2019/09/01(日) 13:11:25.72 ID:xmxF7u0H(1) AAS
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。
622: デフォルトの名無しさん [sage] 2019/09/01(日) 15:24:13.07 ID:Cv4S4gQH(2/2) AAS
>>614
614(2): デフォルトの名無しさん [sage] 2019/09/01(日) 13:35:49.57 ID:JCPxJyAV(1/2) AAS
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www
677: デフォルトの名無しさん [sage] 2019/09/15(日) 04:11:30.07 ID:LMFjfaUx(1) AAS
見せて!
886: デフォルトの名無しさん [] 2020/02/14(金) 17:14:21.07 ID:CPLKNT1n(1) AAS
顔文字より正規表現のためのメタ文字とかあったほうが良いのにね。
まあGoogleじゃ無理か。
993: デフォルトの名無しさん [sage] 2020/07/02(木) 23:07:28.07 ID:NYHAh4sv(1) AAS
>>992
992(1): ◆QZaw55cn4c [sage] 2020/07/02(木) 21:29:50.29 ID:L13EtRzW(1) AAS
>>989
>「高」と「??」
CP932 では区別されているのですか?
区別されてるよ。
「マイクロソフト標準キャラクタセット」で検索すると、
詳しい情報が出てくるよ。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.035s