[過去ログ] 文字コード総合スレ part13 (1002レス)
前次1-
抽出解除 レス栞

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
253: デフォルトの名無しさん [] 2021/10/28(木) 14:40:01.21 ID:cISpGEYl(2/2) AAS
厳密に言うと、(Get-PSReadLineOption).HistorySavePathでは普通の改行は\r\nで複数行にまたがる時に\nが使われている
\rがあればこそできる使い分け
615: デフォルトの名無しさん [sage] 2022/09/17(土) 19:43:06.21 ID:ZRyqS070(1/2) AAS
次は飛び出す絵文字とお喋りする絵文字だよ
646
(1): デフォルトの名無しさん [sage] 2022/10/11(火) 21:16:13.21 ID:Wi4OH2RZ(2/3) AAS
>>645
645(1): デフォルトの名無しさん [sage] 2022/10/11(火) 20:10:00.97 ID:JrNqb+g1(1) AAS
1文字ずつつけるんじゃなくて新たに囲み用の言語指定マーク作ってもいいんでは?
既にLTR/RTL指定とか「ここからここまでルビ」みたいなマークがあるんだから。

どっちの方法でも実効性が現れるかどうかは「メジャーな環境が(入力ユーザーが気にしていなくても)デフォルトで付けるかどうか」次第だけど、
完全IVS化だと漢字圏のテキストがほぼ倍になる、そんなのをデフォルトにする判断を各社が果たしてするんだろうか?
普通の人は字体にこだわらないから付けないだろうし、字体にこだわる著者はサイズが倍以上になってもつけるだろうし選択権が著者側にあるのが良いと思うんだよな。もはやテキストサイズとか誤差の範囲でけちる理由ないし。
日本語と中国語が混じった国際的な文章を書きたい場合とか、1文字単位で指定できるのが重要というか。
761: デフォルトの名無しさん [sage] 2023/02/23(木) 11:04:10.21 ID:9YiKsc0f(1/2) AAS
Excelにutf8食わすときに必要だし、Windows Searchもutf-8はBOM付き前提で、この状況は未だにかわってない
BOMなし教の人はWindow使ってないんじゃないの?w
787: デフォルトの名無しさん [sage] 2023/02/24(金) 08:58:55.21 ID:BmT/WJ86(2/8) AAS
>>785
785(1): デフォルトの名無しさん [sage] 2023/02/24(金) 08:06:25.11 ID:liuYehNm(1/2) AAS
文字コードを自動判別するためにBOMを使うってのがダメだな
BOMと思ったコードが違うエンコーディングの可能性があるんだから
Windows だけで閉じておいてほしいから、通信回線には流さないで
そもそも誰も自動判別の正確性を担保できないからBOMがあるんだろ
Windowsを除外したビジネスで成り立つならそれでいいが、現実はそうじゃない。
他人が対応するのを待つのは無能な人のすることだよ。
806: デフォルトの名無しさん [sage] 2023/02/24(金) 19:13:09.21 ID:/JDec9CR(6/14) AAS
>>804
804(1): デフォルトの名無しさん [sage] 2023/02/24(金) 18:22:32.64 ID:BmT/WJ86(8/8) AAS
BOMを信じた時点でもはや自動判別ではないだろ。
世界には多数の文字コードがあるわけで
完全な自動判別は不可能だって知らないの?
932
(1): デフォルトの名無しさん [] 2023/03/01(水) 10:07:23.21 ID:68s28u+f(2/5) AAS
>>927
927(1): デフォルトの名無しさん [sage] 2023/03/01(水) 07:56:52.79 ID:OaPBPWBe(4/4) AAS
翻訳しときますよ

While there is obviously no need for a byte order signature when using UTF-8,
there are occasions when processes convert UTF-16 or UTF-32 data containing a byte order mark into UTF-8.

UTF-8を使用する場合、バイトオーダー署名は明らかに不要(訳注 禁止ではない)であるが、
プロセスがバイトオーダーマークを含むUTF-16やUTF-32のデータをUTF-8に変換する場合がある。
(訳注 つまり UTF-8 に BOM が含まれることがある)

Its usage at the beginning of a UTF-8 data stream is neither required nor recommended by the Unicode Standard,
but its presence does not affect conformance to the UTF-8 encoding scheme.

UTF-8データストリームの冒頭で使用することは UTF-8データストリームの先頭での使用は、
Unicode Standardでは必須でも推奨でもありませんが、その存在はUTF-8エンコーディングスキームへ
の適合性に影響を与えず、UTF-8エンコーディングスキームへの適合性に影響を与えません。
(訳注 ここからも必須でも推奨でもないだけで、適合性に影響を与えないと書いてある)

Identification of the <EF BB BF> byte sequence at the beginning of a data stream can, however,
be taken as a near-certain indication that the data stream is using the UTF-8 encoding scheme.

データストリームの先頭の<EF BB BF>バイト列の識別は、そのデータストリームがUTF-8エンコーディング方式を
使用していることをほぼ確実に示すものと見なすことができる。
(訳注 UTF-8を使用していると確実に示すという意味だから使っていいということ)
>プロセスがバイトオーダーマークを含むUTF-16やUTF-32のデータをUTF-8に変換する場合がある。
>(訳注 つまり UTF-8 に BOM が含まれることがある)

訳注を善意的に解釈すると
間抜けな変換ツールによる変換時にそのまま先頭のBOMが残ることはあるかも知れないが
新たなプレーンテキストにはBOMは入れないでくれって読めるな
964: デフォルトの名無しさん [] 2023/03/02(木) 11:50:12.21 ID:p0hvnhfU(1) AAS
外部リンク:ascii.jp
外部リンク[php]:ths.ashigeki.net
968
(1): デフォルトの名無しさん [sage] 2023/03/02(木) 13:08:38.21 ID:i0CU6OJ9(1/2) AAS
いや、そこまでしてBOMを避ける理由がわからん
BOMでなければなんでもいいのかよw
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.034s