[過去ログ]
くだらねえ質問はここに書き込め! Part 237 (1002レス)
くだらねえ質問はここに書き込め! Part 237 http://mao.5ch.net/test/read.cgi/linux/1563027196/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
388: login:Penguin [sage] 2019/08/19(月) 21:13:40.22 ID:rdD101AG EUC-JPの欠点って文字種が日本寄りであること以外になにかある? 例えばShift-JISだと いわゆる「ダメ文字」の問題があるけどEUC-JPに関してはそれはないよね。 http://mao.5ch.net/test/read.cgi/linux/1563027196/388
390: login:Penguin [sage] 2019/08/19(月) 22:00:07.73 ID:vbD6eBT6 >>388 これ https://ja.wikipedia.org/wiki/%E5%8D%8A%E8%A7%92%E3%82%AB%E3%83%8A#EUC-JP 日本語EUC (EUC-JP) も8ビット環境を前提とした文字コードだが、JIS X 0208の1文字目にあたるコードは、 JIS X 0201を1バイトで表した場合の半角カナ部分に重なるように配置されている。 そのため、半角カナに相当する文字を使用する必要がある場合は制御文字SS2(シングルシフト2、0x8E)に 続けて使用することになる(このため一見2バイトに見えるが、SS2は文字集合を次の1文字分だけ切り替えるという印のため、片仮名自体はやはり1バイトで符号化される)。この記法によるカナ使用を実装していない処理系も多い。 EUC-JPにおいてJIS X 0208を表すために使用されるコード範囲 (0xA1-0xFE) は、1バイトカナの コード範囲 (0xA1-0xDF) を完全に内包するため、偶数の文字数で書かれたShift_JISの半角カナは、 EUC-JP文字列と(頻度やパターンからの推測以外の方 http://mao.5ch.net/test/read.cgi/linux/1563027196/390
392: login:Penguin [sage] 2019/08/20(火) 14:19:28.43 ID:A4AxE3As >>388 UTF-8と比較すると、UTF-8は1バイト目と2バイト目の範囲が重ならないようにデザインされているので検索で文字境界がずれて引っかかることがないのに対し、EUC-JPはずれて関係ないところが引っかかる可能性がある。 http://mao.5ch.net/test/read.cgi/linux/1563027196/392
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.029s