[過去ログ] 文字コード総合スレ Part11 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1(3): 2018/01/22(月)22:58 ID:UK/uqEp5(1/10) AAS
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 2chスレ:tech
文字コード総合スレ part2 2chスレ:tech
文字コード総合スレ part3 2chスレ:tech
文字コード総合スレ part4 2chスレ:tech
省8
973: 2018/12/15(土)14:24 ID:/xz8BzsC(1) AAS
Windows 10 Insider Preview、メモ帳でBOMなしのUTF-8が選択可能に | スラド デベロッパー
外部リンク:developers.srad.jp
ついに
974: 2018/12/15(土)14:46 ID:Sg9amITu(1/2) AAS
BOMカットするのなんてマなら簡単だろ
975(2): 2018/12/15(土)15:14 ID:+6LwXb2C(1) AAS
マジかよ圧倒的シェアのWindowsがBOM付きだからという理由で自分は全部BOM月にしてたのに梯子外されたのかよ
976: 2018/12/15(土)15:21 ID:Sg9amITu(2/2) AAS
SJIS絶滅はよ
977: 2018/12/15(土)15:27 ID:EyhC0X8P(1/2) AAS
>>975
わざとらしい。Windowsのネイティブ文字コードはUTF16なんだから普通はUTF16を使うだろ
メモ帳で保存するときに、Unicodeを選んだらUTF16になる
UnicodeといえばUTF16のこと
978(1): ◆QZaw55cn4c 2018/12/15(土)15:27 ID:jYtCORiK(1/2) AAS
>>975
そもそも Byte Order Mark の必要のない UTF-8 に BOM を付けていることが論理的に矛盾していますよね
979(1): 2018/12/15(土)15:44 ID:EyhC0X8P(2/2) AAS
>>978
UTF-8の使用によると、BOMは文書がUnicodeであることを
自動判定するためにも用いられるらしい
だから名前がおかしいってのはあるけど、機能的には仕様どおりの使い方
980: ◆QZaw55cn4c 2018/12/15(土)20:22 ID:jYtCORiK(2/2) AAS
>>979
>UTF-8の仕様によると、BOMは文書がUnicodeであることを自動判定するためにも用いられる
>らしい
らしい、ですか…
本当にそうなのか確かめてみました。RFC3629 外部リンク:tools.ietf.org の記述は
The UCS character U+FEFF "ZERO WIDTH NO-BREAK SPACE" is also known
informally as "BYTE ORDER MARK" (abbreviated "BOM").
BOM は本来は「ゼロ長割り込みなしスペース」という意味らしいですね…
ながながとあれやこれは書いてあったのですが結論はよくわからないです、誰か英語のできる人、どこを読めばいいか教えてください…
981: 2018/12/15(土)21:51 ID:px2y3yP7(1) AAS
ISO10646では誤解を受けそうなBOMという呼び名は使われていなくてSignatureと言うらしい。
現在ではU+FEFFは専らSignatureを表すものとして、もともとのゼロ幅ノーブレークスペースの意味で
使用することは推奨されていない。代わりにU+2060 WORD JOINERを使用することになっている。
982: 2018/12/15(土)23:06 ID:8aRCy95z(1) AAS
やはり頭悪いのはunicodeと符号化を混同してる
文書は符号化されたunicodeということになる
2つ以上のオクテットを使う符号単位で
BOM入れないヤツは池沼だからな
983: 2018/12/16(日)00:59 ID:0WbTxJge(1) AAS
WindowsがなぜUTF-16のことをUnicodeといっているかというと、
Windows NT 初代の3.1(1994年)当時は世界中の文字は16bitで
全て表現できると思われていたからだよ。
Windows NTは最初からUnicodeに対応したOSなのだが、
当時はUnicode = 16bit = UTF-16が成り立っていた
それが間違っているとわかってUnicodeが21bitに拡張されたのが
Unicode 2.0 (1996年7月)
メモ帳がUTF-16をUnicodeと表現するのはその名残りだよ
そういう歴史を知らないで語ると恥をかく
984: 2018/12/16(日)02:37 ID:/e3hQGaS(1/3) AAS
その当時の話をするならUCS-2じゃないの?
985(1): 2018/12/16(日)05:34 ID:oz52hRFm(1/3) AAS
寿司と言えば江戸だったから江戸前って名前になった、まで読んだ。
986: 2018/12/16(日)11:01 ID:0qV7OEGg(1) AAS
時すでにお寿司
987(1): 2018/12/16(日)12:33 ID:GapmNYlr(1) AAS
>>985
988: 2018/12/16(日)12:35 ID:VlX3xGEw(1) AAS
寿司と言えば江戸ではなかったから、
江戸の寿司と強調したいときは、わざわざ江戸前寿司というようになった
ではないのか?
989: 2018/12/16(日)13:50 ID:52dtexo8(1) AAS
寿司食いねえ! 🍣
990: 2018/12/16(日)15:02 ID:/e3hQGaS(2/3) AAS
押し寿司とかなれ寿司が寿司だよな。
酢で酸っぱくした寿司なんかフェイク寿司もいいところ。
991: 2018/12/16(日)18:49 ID:A6SlBDUO(1) AAS
押し寿司も酢飯使ってるよ
992: 2018/12/16(日)20:12 ID:oz52hRFm(2/3) AAS
火縄銃といえば種子島だから種子島って名前になった、まで読んだ
993: 2018/12/16(日)20:40 ID:Ux2imWCY(1) AAS
違うぞ。種子島の種とは、
子種のことだぞ。
種子島=子種島=ザーメン島
994: 2018/12/16(日)21:01 ID:/e3hQGaS(3/3) AAS
だから鉄砲はぴゅぴゅっと出るんですね
995: 2018/12/16(日)21:10 ID:oz52hRFm(3/3) AAS
>>987
日本語でok
996(1): 2018/12/17(月)16:59 ID:Pfqpaohb(1) AAS
新スレ
文字コード総合スレ Part12
2chスレ:tech
997: 2018/12/17(月)21:10 ID:ncIi/eoH(1) AAS
ドイツ語だと植物の種子も同じだからどうでもいい。
998: 2018/12/17(月)21:18 ID:lO+98ZHR(1) AAS
次スレ
文字コード総合スレ Part12
2chスレ:tech
999: 2018/12/17(月)22:43 ID:iPWzsOu1(1) AAS
>>996
thanx
1000: 2018/12/18(火)01:01 ID:dCapM8E2(1) AAS
次スレなぜか分裂
1001(1): 1001 ID:Thread(1/2) AAS
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 329日 2時間 3分 30秒
1002(1): 1002 ID:Thread(2/2) AAS
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
省4
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.271s*