文字コード総合スレ part15 (462レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
427: デフォルトの名無しさん [sage] 2025/08/20(水) 17:25:07.68 ID:6T31eh60 >>423 SJISなんてものを褒め称えるとはマイクロソフト信者かね 昔からメールなどネット上ではいわゆるJISコード(ISO-2022-JP)が使われてきてこちらが国際的にも通用する主流でUNIXなどではEUC-JPが標準 もちろん今では国際的にUNICODEで統一され符号化はネット上もファイル保存もUTF8だがマイクロソフトさんは http://mevius.5ch.net/test/read.cgi/tech/1723861080/427
428: デフォルトの名無しさん [sage] 2025/08/20(水) 18:20:43.93 ID:gymbsza2 unicode 出る前からフォントは複数の文字コード対応マップで多言語化されれたことを知らないんだろうな http://mevius.5ch.net/test/read.cgi/tech/1723861080/428
429: デフォルトの名無しさん [sage] 2025/08/20(水) 19:22:16.58 ID:6T31eh60 SJISが世界の全てだった人なんだろうね http://mevius.5ch.net/test/read.cgi/tech/1723861080/429
430: デフォルトの名無しさん [sage] 2025/08/20(水) 21:05:49.55 ID:Qtedysji >>427 JISがメールで使われてたのは7bit透過だからだぞ SJIS信者だと思うのは自由だが、PDFのコピペに関しては、今風に言うと現場猫だよ PDF仕様猫:グリフが重複して使われるフォントなんて普通ないからヨシッ PDF出力アプリ猫:同上、ヨシッ google猫:PDF出力アプリが対応してればグリフが重複してもヨシッ unicode猫:同じ字(でもないが)に複数の文字コードを割り当てても、アプリかフォントが対応してればヨシッ MS:普通、部首素片と通常文字は別グリフだろ、これで何も問題なくなるし フォントがどうであれ、アプリ側で対応出来るのは事実なので、アプリが一番悪い 次に悪いのはフォントで、手抜きでなければ部首素片と通常文字は別グリフになるように思う ただしそもそものunicodeの思想が間違ってて、そもそも統合漢字としてるCJKの通常文字、 日本人と台湾人と中国人の美的感覚は異なるだろうから、同一グリフで何とかなると考えてる所に無理がある ただ、欧米も同様にアルファベットの美的感覚が微妙には異なるはずなので、連中が問題ないからCJKも問題ないと思ったのかな、とは思う (ここらへんは文化の結合度によるが、欧米ほど人が交流してれば美的感覚もそれなりに共有されてるのかもしれん) というか、具体的に言うと「骨」(0x9aa8)や「曜」(0x66dc)、これらは美的感覚ではなくモロに別形だが CJK統合漢字という根本的なとこから間違ってるよねと というかこれらが別コードとして登録されなかった理由は何なんだ?今更異体字ダーとかやってるのに http://mevius.5ch.net/test/read.cgi/tech/1723861080/430
431: デフォルトの名無しさん [sage] 2025/08/20(水) 21:08:26.58 ID:Qtedysji ん?2行連続空行は削除されるようになったのか? まあちと読みにくくなってるが、よろしく http://mevius.5ch.net/test/read.cgi/tech/1723861080/431
432: デフォルトの名無しさん [sage] 2025/08/21(木) 02:20:32.36 ID:X0ZtFPzr 一つ一つの技術を正しく理解していないから、文字通り「個人の感想ですよね」という まあ5ちゃんだし、酒飲み話みたいのもアリだとは思うけど 正しい知識が元になっていればそれは役に立つ話にもなる 一方読む方は間違いを間違いと見抜く力が.... って決してひろゆき信者ではないw http://mevius.5ch.net/test/read.cgi/tech/1723861080/432
433: デフォルトの名無しさん [sage] 2025/08/21(木) 02:56:06.57 ID:D3EzSAOJ 私も世界にSJISさえアレば良かった人間です(過去形)。欲しい文字は外字にドット打ってました。 ROMに第2水準程度しか乗っていない8ビットや16ビット世代のマシンでUTF8を構築するのって、現実的に可能なのかしら。 興味本位の疑問だけど。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/433
434: デフォルトの名無しさん [sage] 2025/08/21(木) 04:47:17.94 ID:HC849JP7 交換用符号としての扱いは楽だけど ROMのコードがJISだから変換マップをオンメモリにするのは厳しそう 索引付きでないと性能でないと思うから これもROMで持てるならあり もちろん幅や方向、合字なんかは扱えない http://mevius.5ch.net/test/read.cgi/tech/1723861080/434
435: デフォルトの名無しさん [sage] 2025/08/21(木) 05:18:08.01 ID:mNeC3fTJ >>433 そこはSJISとUTF8といった符号化方式の比較でなくてJIS漢字コードとユニコードの比較で十分 漢字ROMのデータ収録順序はJIS漢字コードの機械的変換できる範囲内だろうから ユニコードからJIS漢字コードへのマッピング http://mevius.5ch.net/test/read.cgi/tech/1723861080/435
436: デフォルトの名無しさん [sage] 2025/08/21(木) 05:33:29.34 ID:lFCpHxq7 いわゆる半角カタカナ等(JIS X 0201)と全角漢字等(JIS X 0208)のほとんどは規則的変換できるようにユニコード内に収容されている 例外は一部の記号や文字のみ したがって漢字ROM読み出しもほとんどは規則的変換できて例外のみ対応で実用的かな http://mevius.5ch.net/test/read.cgi/tech/1723861080/436
437: デフォルトの名無しさん [sage] 2025/08/21(木) 06:14:19.45 ID:BA9KDvPD 漢字は厳しいだろ 偶然だが半角の途中まではEF BDを前置するとUTF8 A1 。 EF BD A1 AF ッ EF BD AF B0 ー EF BD B0 B1 ア EF BD B1 B2 イ EF BD B2 B3 ウ EF BD B3 B4 エ EF BD B4 B5 オ EF BD B5 BF ソ EF BD BF http://mevius.5ch.net/test/read.cgi/tech/1723861080/437
438: デフォルトの名無しさん [sage] 2025/08/21(木) 08:42:01.26 ID:YIWSP+jR >>436 JIS/SJIS/EUC: https://manuals.ricoh.com/mfp/p_manual/MPC6004JPN/ja/intro/int/r_cjr041.htm unicode: https://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/cjku_klist.html さすがゆとりZ、無敵すぎ http://mevius.5ch.net/test/read.cgi/tech/1723861080/438
439: デフォルトの名無しさん [sage] 2025/08/21(木) 09:07:08.19 ID:4FAr+8B9 >>436 昔のAIにSJISをunicodeに変換するコード書かせたら何故かテーブルもってなくて機械的にシフトと論理演算で変換できますってコード出されたって話を思い出した お前、そのAIだったりしないか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/439
440: デフォルトの名無しさん [sage] 2025/08/21(木) 16:15:00.95 ID:jm5fSTrV >>438 >JIS/SJIS/EUC: https://manuals.ricoh.com/mfp/p_manual/MPC6004JPN/ja/intro/int/r_cjr041.htm 区点コードで文字入力とはシブい。しかし字形が2004じゃないのは果たして マニュアルだけの話でプリントで使うフォントとかは別なのかな。にしても http://mevius.5ch.net/test/read.cgi/tech/1723861080/440
441: デフォルトの名無しさん [sage] 2025/08/21(木) 21:08:42.64 ID:YIWSP+jR >>440 何が言いたいのか分からんが、こちらの意図を明確にしておくと、 ただ単に「JIS 漢字表」でググって並び順が見やすいのを選んだだけ コードなら以下が見やすいかと http://www.infonet.co.jp/ueyama/ip/binary/x0208txt.html JIS等は漢字もあいうえお順(ricohのサイトはまんまアイウエオで見やすい) てかunicodeって何順? http://mevius.5ch.net/test/read.cgi/tech/1723861080/441
442: デフォルトの名無しさん [sage] 2025/08/22(金) 21:59:54.85 ID:SVHvHw/K https://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/cjku_radical.html >UnicodeのCJK統合漢字は、概ね部首順(部首内は画数順)に並んでいます http://mevius.5ch.net/test/read.cgi/tech/1723861080/442
443: デフォルトの名無しさん [sage] 2025/08/23(土) 02:24:50.51 ID:/wnxORck しかしこれらの部首って、例のUnicodeの漢字部首のコードポイントに頼らなくても 出せるのね。元々各国の文字コードに部首のコードがあってそれがUnicodeに 引き継がれているようで JISでも第二水準にちょいちょい部首が入っている。冫(にすい)とか だがしかし「さんずい」や「しんにょう」などは第二水準にはない これって何故でしたっけ。まさか さんずい=水に「包摂」とか? ??? http://mevius.5ch.net/test/read.cgi/tech/1723861080/443
444: デフォルトの名無しさん [sage] 2025/08/23(土) 06:47:36.46 ID:0WleoknD >>443 氵も 辶 もJISにあるだろ (JIIS補助漢字または第4水準だが、包摂ではない) もちろん Unicode も部首素片以外に漢字側にも登録がある 冫だけ第2水準なのは教科書とかで使用例があったから(うろ覚え) http://mevius.5ch.net/test/read.cgi/tech/1723861080/444
445: デフォルトの名無しさん [sage] 2025/08/23(土) 07:30:15.06 ID:0WleoknD 大元の理由が知りたいというい意味ならこの辺は漢字の歴史に由来していて 「冫」は甲骨の時代から独立した漢字で「氷」は字源的には「冫+水」の「冰」の略字 「氵」は「水」が部首になった時の省略形で昔の漢字では2つは全く同じ字形 unicode でも「冫」は漢字としてのみ登録されていて、部首素片(CJK Radical)には無かったはず http://mevius.5ch.net/test/read.cgi/tech/1723861080/445
446: デフォルトの名無しさん [sage] 2025/08/23(土) 08:40:59.48 ID:baE/iOEd >>444 「第二水準内で」(第四水準がなかった時代に)という意味です 第四がある現在では包摂の適用が変わりましたので >>445 JISの中の人がどう考えていたのか気になりました 「冫」は康熙部首の方にありますね(U+2F0E) どうやら康熙部首がメインでCJK部首が補助のようですが、件の「長」は何故か両方に と思いきや、CJK部首の「長」は縦の棒が上から下まで繋がっている(画数が-1)とかいう話 そんなんわかるかあw http://mevius.5ch.net/test/read.cgi/tech/1723861080/446
447: デフォルトの名無しさん [sage] 2025/08/23(土) 08:52:37.93 ID:wdSAuDDp >>444 「第二水準内で」(第四水準がなかった時代に)という意味です 第三以降では包摂の適用が変わったので、同列には語れません >>445 JISの中の人がどう考えていたのか気になりました 「冫」は康熙部首の方にありますね(U+2F0E) どうやら康熙部首がメインでCJK部首にはそのバリエーションが なのに「長」は何故か両方に同じものが入っている?? と思いきや、CJK部首の「長」は縦の棒が上から下まで繋がっている(画数が-1)とかいう話 そんなんわかるかあw http://mevius.5ch.net/test/read.cgi/tech/1723861080/447
448: デフォルトの名無しさん [sage] 2025/08/23(土) 08:56:22.55 ID:yzoynflT 失礼、投稿が失敗したと思いダブリました(&少し書き直した) http://mevius.5ch.net/test/read.cgi/tech/1723861080/448
449: デフォルトの名無しさん [sage] 2025/08/23(土) 09:10:23.66 ID:0dLwdQt1 >>446 > CJK部首の「長」は縦の棒が上から下まで繋がっている(画数が-1)とかいう話 ならばgoogle猫が手抜きで糞フォントを作ったのがPDFコピペ文字化けの元凶だな 日本人の美的感覚では、(この辺は習字を見れば分かりやすい) 「長」の縦棒は、上よりも下のほうが少し左側(下のほうが広く見える)が美しいとされるので、 真面目にフォントを作れば同じグリフになることはない http://mevius.5ch.net/test/read.cgi/tech/1723861080/449
450: デフォルトの名無しさん [sage] 2025/08/23(土) 12:38:53.36 ID:0WleoknD >>447 そういう意味なら「康熙部首」はもともと部品じゃなくて普通に使われる漢字なのでJIS的には漢字として登録されるのは問題ない (康煕部首を漢字以外に登録しているunicode が変というかローマ数字の ⅰ がアルファベットの i と別にあるみたいな変さ) 「氵」とかは伝統的な漢字じゃないので(辞典類の索引くらいしか)単独の用例が存在していなかったのが理由じゃないかな 国語の教科書とかでも康煕準拠で「冫の部」とういう表記は使われるけど「氵の部」という部首は存在してなくて「水の部」と書かれてる 第3、第4水準の包摂基準は原則として第1、第2の基準を援用してるので第2水準で包摂されていたら第4水準に追加できないので、逆説的に第4水準に追加されたことは包摂されていなかった解釈になる(補助漢字はかなりあやしい http://mevius.5ch.net/test/read.cgi/tech/1723861080/450
451: デフォルトの名無しさん [sage] 2025/08/23(土) 12:45:02.17 ID:0WleoknD >>449 文字をどのようにデザインするかはフォントごとの勝手、文字コードでは規定していない いやならそのフォントを使わなければ良い ゴシック体で画数と意識してられるかアホらしい http://mevius.5ch.net/test/read.cgi/tech/1723861080/451
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 11 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.017s