[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
783
(2): デフォルトの名無しさん [sage] 2023/02/24(金) 03:29:22.76 ID:zsYMclLz(1/7) AAS
今後はファイルや外部通信はUTF-8がデフォルトになる
逆にいうとBOMついてないのは全てUTF-8とみなされる
よってUTF-8にBOMは不要
この単純なロジックが理解できないやつはかわいそう
796
(2): デフォルトの名無しさん [sage] 2023/02/24(金) 13:59:12.56 ID:zsYMclLz(2/7) AAS
>>792
792(1): デフォルトの名無しさん [sage] 2023/02/24(金) 13:10:51.59 ID:8I4EMiY9(4/4) AAS
それで,Windows は先頭にBOM を入れるというのをアウトオブバンドで決めてる訳
だから,Windows で勝手にしてね。Windows 以外には送らないでって話
Windowsではとか言ってる時点で国際化とか文字コードのこと全く知らない無知だろ。単に「日本語Windows」で使われてたCP932がUTF-8のBOMとかぶってなかっただけ。
英語Windowsで使われてたCP1252とかは EF BB BF にもそれぞれ文字が割当れらてるのでBOMとかあっても区別できばない。他の多くの文字コードもそうだし、CP932/SJIS なんかより断然現有の資産も多い。
おま国事情でたまたまうまくいってるだけなんて、一般化や標準化されるわけないだろ
797: デフォルトの名無しさん [sage] 2023/02/24(金) 14:02:43.91 ID:zsYMclLz(3/7) AAS
>>796
792の返信にしたけど、792を批判したいわけではなくて、WindowsではBOMが便利という一般論を否定したかっただけ。
それは単なる日本しか知らない蛙仕草。
803: デフォルトの名無しさん [sage] 2023/02/24(金) 18:05:09.63 ID:zsYMclLz(4/7) AAS
>>799
799(1): デフォルトの名無しさん [sage] 2023/02/24(金) 14:42:29.80 ID:dKpgt1DZ(1) AAS
海外ではこうとか、本来こうあるべきとか、どうでも良いんだよ
日本語のテキストファイルを読み込むプログラムの仕様としてSJIS/UTF8自動判別にした場合、
確実に文字化けしないのはBOM付きUTF-8だけという事実は考慮すべき
そもそも自動判別は悪という流れになってることすら知らないんだな。
セキュリティホールやバグの温床になるので文字コードの自動判別はなくすのが世界の流れ。特に確実性のない自動判別は害悪でしかない。
819
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 22:24:35.19 ID:zsYMclLz(5/7) AAS
>>814
814(1): デフォルトの名無しさん [sage] 2023/02/24(金) 19:30:00.43 ID:/JDec9CR(12/14) AAS
間違えた

echo あいうえお | cut -c 4-
いうえお
そもそも -c オプションは現在 -b (バイト指定)と同じ動きというのが仕様なので文字コードもくそもない。
マニュアル嫁。
820: デフォルトの名無しさん [sage] 2023/02/24(金) 22:30:50.23 ID:zsYMclLz(6/7) AAS
>>815
815(1): デフォルトの名無しさん [sage] 2023/02/24(金) 19:36:38.85 ID:EbaJyZ/f(1) AAS
業界人ですら認識ちがいのある文字コード。素人に説明するの超絶に面倒。
いや、このスレは素人が跋扈してるだけに過ぎないと思うが。
文字コードやネット・プロトコルの専門家で、「今後は外部は UTF-8 がデフォルト」って以外の意見は聞いたことがない。
823
(1): デフォルトの名無しさん [sage] 2023/02/24(金) 23:31:32.12 ID:zsYMclLz(7/7) AAS
>>822
822(1): デフォルトの名無しさん [sage] 2023/02/24(金) 23:18:05.18 ID:/JDec9CR(14/14) AAS
>>819
どこにも同じ動きとは書いていない

外部リンク[html]:pubs.opengroup.org

-b list
Cut based on a list of bytes. Each selected byte shall be output unless the -n option is also specified.
It shall not be an error to select bytes not present in the input line.

-c list
Cut based on a list of characters. Each selected character shall be output.
It shall not be an error to select characters not present in the input line.
linux なら linux のマニュアル嫁。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.504s*