[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
777
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 00:16:53.98 ID:/JDec9CR(1/14) AAS
>>700
700(1): デフォルトの名無しさん [sage] 2023/02/12(日) 12:22:59.98 ID:2oU17ty6(1) AAS
Linux は内部的には、UTF32 も使っているけど、外には出ない。
外部とはUTF8 で統一されている

Windows のCP 何々みたいなものは地獄。
他国語のCPを誰も知らない

例えば日本人だと、CP932 しか知らない。
逆に外人は、誰もCP932を知らない

つまり、外人同士が意思疎通できないシステム

ただし、Linuxでも、iconv を使うけど、
Ruby では非推奨になって、NKF を使う

今では、CP932とか日本語を扱えるのは、Rubyだけだろ。
外人は誰も、CP932など知らない
Windowsは内部的にはUTF16で統一されてるよ
そこはLinuxよりも優れた設計
778: デフォルトの名無しさん [sage] 2023/02/24(金) 00:17:46.23 ID:/JDec9CR(2/14) AAS
> UTF-8で保存するならBOMをつける必要などどこにもないだろうよ
BOMをつけないと他の文字コードとの区別ができなくて
文字化けしてしまう
779: デフォルトの名無しさん [sage] 2023/02/24(金) 00:19:03.22 ID:/JDec9CR(3/14) AAS
だいたいUTF-8のBOMはUnicodeの正式な仕様なのだから
対応してないほうが悪い
780
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 00:22:30.88 ID:/JDec9CR(4/14) AAS
LinuxとかmacOSとかUnixはUnicodeの対応が遅れていて
LANG=C.UTF-8でさえPOSIXで標準化されていない
Unicodeを正しく扱えないコマンドがある
805: デフォルトの名無しさん [sage] 2023/02/24(金) 19:12:21.37 ID:/JDec9CR(5/14) AAS
>>786
786(1): デフォルトの名無しさん [sage] 2023/02/24(金) 08:34:34.48 ID:b+y25Gbd(1) AAS
>>777
> Windowsは内部的にはUTF16で統一されてるよ
ワイドキャラクタがUTF-16で統一されているという意味なら
Linuxも20年以上前のglibc-2.0からUTF-32で統一されているよ

ワイドキャラクタ以外アプリ等が独自に他の符号化方式を
採用している場合があるのも同じ
> Linuxも20年以上前のglibc-2.0からUTF-32で統一されているよ
それでマウントとったつもりだろうが
Windows NTがUnicodeに対応したのは30年前だ
806: デフォルトの名無しさん [sage] 2023/02/24(金) 19:13:09.21 ID:/JDec9CR(6/14) AAS
>>804
804(1): デフォルトの名無しさん [sage] 2023/02/24(金) 18:22:32.64 ID:BmT/WJ86(8/8) AAS
BOMを信じた時点でもはや自動判別ではないだろ。
世界には多数の文字コードがあるわけで
完全な自動判別は不可能だって知らないの?
807: デフォルトの名無しさん [sage] 2023/02/24(金) 19:20:45.75 ID:/JDec9CR(7/14) AAS
>>783
783(2): デフォルトの名無しさん [sage] 2023/02/24(金) 03:29:22.76 ID:zsYMclLz(1/7) AAS
今後はファイルや外部通信はUTF-8がデフォルトになる
逆にいうとBOMついてないのは全てUTF-8とみなされる
よってUTF-8にBOMは不要
この単純なロジックが理解できないやつはかわいそう
> 逆にいうとBOMついてないのは全てUTF-8とみなされる
> よってUTF-8にBOMは不要
あのー、Unicode以外の全ての文字コードにはBOMがついてないんですけど?
808: デフォルトの名無しさん [sage] 2023/02/24(金) 19:22:18.48 ID:/JDec9CR(8/14) AAS
>>781
781(3): デフォルトの名無しさん [sage] 2023/02/24(金) 00:50:08.17 ID:rqUoHIRk(1) AAS
>>780
いったいいつの時代の話をしてるんだ
具体的なコマンド名とディストリビューションを挙げてみろや
> 具体的なコマンド名とディストリビューションを挙げてみろや

echo あいうえお | mawk '{ print length($0) }'
15
810: デフォルトの名無しさん [sage] 2023/02/24(金) 19:23:32.40 ID:/JDec9CR(9/14) AAS
>>781
echo あいうえお | dash -c 'read line; echo ${#line}'
15
811: デフォルトの名無しさん [sage] 2023/02/24(金) 19:24:26.90 ID:/JDec9CR(10/14) AAS
>>809
809(1): デフォルトの名無しさん [sage] 2023/02/24(金) 19:23:31.95 ID:vCNNlHyw(1) AAS
まだunicode以外の文字コードを使う気かよ
化石なん?
今すぐこれまでの資産をUnicodeに変換してみせろよw
813: デフォルトの名無しさん [sage] 2023/02/24(金) 19:28:34.50 ID:/JDec9CR(11/14) AAS
>>781
echo あいうえお | cut -b 4-
いうえお
814
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 19:30:00.43 ID:/JDec9CR(12/14) AAS
間違えた

echo あいうえお | cut -c 4-
いうえお
821
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 23:16:35.23 ID:/JDec9CR(13/14) AAS
>>817
817(1): デフォルトの名無しさん [sage] 2023/02/24(金) 21:08:47.90 ID:Ww2YDdfR(1) AAS
誰も>>794はスルーするんだな?w
スルーしてないだろ
ちゃんと読めよ
わざとか?
822
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 23:18:05.18 ID:/JDec9CR(14/14) AAS
>>819
819(1): デフォルトの名無しさん [sage] 2023/02/24(金) 22:24:35.19 ID:zsYMclLz(5/7) AAS
>>814
そもそも -c オプションは現在 -b (バイト指定)と同じ動きというのが仕様なので文字コードもくそもない。
マニュアル嫁。
どこにも同じ動きとは書いていない

外部リンク[html]:pubs.opengroup.org

-b list
Cut based on a list of bytes. Each selected byte shall be output unless the -n option is also specified.
It shall not be an error to select bytes not present in the input line.

-c list
Cut based on a list of characters. Each selected character shall be output.
It shall not be an error to select characters not present in the input line.
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.042s