文字コード総合スレ part15 (462レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
420: デフォルトの名無しさん [sage] 2025/08/20(水) 00:55:18.59 ID:hGmntMeI >>418みたいのって、どこかに書いてあるのでしょうか それとも純粋に個人的な発想でしょうか http://mevius.5ch.net/test/read.cgi/tech/1723861080/420
421: デフォルトの名無しさん [sage] 2025/08/20(水) 01:07:20.10 ID:gymbsza2 >>420 opentype とか truetype とかもっと古い type1 とかフォントの規格と歴史を勉強しろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/421
422: デフォルトの名無しさん [sage] 2025/08/20(水) 13:03:56.81 ID:NLPMnvCO >>421 なるほど、そういったものを経て>>418のような知識につながったと。興味深いです http://mevius.5ch.net/test/read.cgi/tech/1723861080/422
423: デフォルトの名無しさん [sage] 2025/08/20(水) 14:23:04.97 ID:bjR6GZEK >>418 お前が相変わらずアホなだけ 実際、SJIS時代に多言語対応フォントなんて誰も使ってなかったろ お前は仕様的に出来る/出来ない事と、実際にみんながどう運用してるかの区別が付いてない 仕様が完全でなくても、通常の運用では十分カバー出来てた事を、 無駄に意識高いお前のような馬鹿が「仕様ガー悪いノデー僕は悪くアリマセンー」なノリで不用意に そこらの意識低いド平民にも問題を強制的に「再発見」させたのはunicodeだろ しかもunicodeでもグリフを重
複させていなければ回避出来た話 (そもそも部首素片と一般の字のグリフが同じなのはただの手抜きな気がするのだが、 一般的に同じグリフにするのが正しいのだろうか?) その他も含めて見る限り、unicodeは無駄に意識高い馬鹿が作った仕様で、実際の運用には向いてない感じだけど MSはこの辺昔から泥臭くて、仕様の綺麗さより実際の使い勝手を重視するので、フォントもそうなってるだけ (まあPDFのコピペ文字化けについては、 お前的にはunicodeではなくフォント『だけの』問題だ、としたいのだろうが、 unicodeがその他諸々糞で、この問題でも誘発源
になってるのは事実だろ) そしてふと考えてみるに、unicodeの利点って、 ・文字化けしない だけで、これ以外は全て以前のSJISの方が良い気がしてきた 勿論これだけで十分な利点だし、SJIS以前の仕様はCPUが非力な時代の産物だから運用向きなのも事実だが http://mevius.5ch.net/test/read.cgi/tech/1723861080/423
424: デフォルトの名無しさん [sage] 2025/08/20(水) 15:48:16.32 ID:EXUVzrtL 絶対負けを認めないマン http://mevius.5ch.net/test/read.cgi/tech/1723861080/424
425: デフォルトの名無しさん [sage] 2025/08/20(水) 16:40:06.57 ID:bjR6GZEK 勝った負けたではなく、俺の認識はこう、ということ お前がそう思わないのはお前の自由 (というか、何でも勝った負けたになるのは議論出来ない馬鹿の特徴 そもそも「議論」に勝った負けたはない 勝った負けたがあるのは「討論」=決を採る段階で、5chで(というよりネットで)決採る意味はないから、 そもそもネットでのほぼ全部の議論に勝った負けたはない その辺ひろゆきも大幅に勘違いしてるし、信奉者も同程度 つかね、論破に拘ってる=論破して喜べる=普段なかなか論
破出来てない=馬鹿 ということなので、自分で自己紹介しなくても、とは思うのだが) PDFの仕様が完璧でなかったにせよ、 SJIS時代にMS明朝等使ってた人=一般の人ほぼ全員は遭遇しなかった問題だろ ・MSが上手く回避策を実行してくれてた事を感謝するタイプか、(正確にはMSがではなく、普通に作ったら回避出来るとも思うが) ・俺が何をやるにしても自由だからとにかく仕様が悪いと言い張るタイプかの違いだよ 俺は前者、unicode連中やお前らは後者、ということ ただ実際、unicodeはもう一度綺麗に作り直さないと駄目な程度に酷い仕様になってきてる
よ しかしこれはunicodeの唯一の利点=文字化けしないを消す事になるから、死んでもやらないのだろうけど となると、どこまで行けるか?というチキンレースにはなってるよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/425
426: デフォルトの名無しさん [sage] 2025/08/20(水) 16:44:32.21 ID:rn5+zHEj さんざんマウント取る言い方してきて、勝った負けたの勝負じゃないだとw クソダサ http://mevius.5ch.net/test/read.cgi/tech/1723861080/426
427: デフォルトの名無しさん [sage] 2025/08/20(水) 17:25:07.68 ID:6T31eh60 >>423 SJISなんてものを褒め称えるとはマイクロソフト信者かね 昔からメールなどネット上ではいわゆるJISコード(ISO-2022-JP)が使われてきてこちらが国際的にも通用する主流でUNIXなどではEUC-JPが標準 もちろん今では国際的にUNICODEで統一され符号化はネット上もファイル保存もUTF8だがマイクロソフトさんは http://mevius.5ch.net/test/read.cgi/tech/1723861080/427
428: デフォルトの名無しさん [sage] 2025/08/20(水) 18:20:43.93 ID:gymbsza2 unicode 出る前からフォントは複数の文字コード対応マップで多言語化されれたことを知らないんだろうな http://mevius.5ch.net/test/read.cgi/tech/1723861080/428
429: デフォルトの名無しさん [sage] 2025/08/20(水) 19:22:16.58 ID:6T31eh60 SJISが世界の全てだった人なんだろうね http://mevius.5ch.net/test/read.cgi/tech/1723861080/429
430: デフォルトの名無しさん [sage] 2025/08/20(水) 21:05:49.55 ID:Qtedysji >>427 JISがメールで使われてたのは7bit透過だからだぞ SJIS信者だと思うのは自由だが、PDFのコピペに関しては、今風に言うと現場猫だよ PDF仕様猫:グリフが重複して使われるフォントなんて普通ないからヨシッ PDF出力アプリ猫:同上、ヨシッ google猫:PDF出力アプリが対応してればグリフが重複してもヨシッ unicode猫:同じ字(でもないが)に複数の文字コードを割り当てても、アプリかフォントが対応してればヨシッ MS:普通、部首素片と通常文字は別グリフだろ
、これで何も問題なくなるし フォントがどうであれ、アプリ側で対応出来るのは事実なので、アプリが一番悪い 次に悪いのはフォントで、手抜きでなければ部首素片と通常文字は別グリフになるように思う ただしそもそものunicodeの思想が間違ってて、そもそも統合漢字としてるCJKの通常文字、 日本人と台湾人と中国人の美的感覚は異なるだろうから、同一グリフで何とかなると考えてる所に無理がある ただ、欧米も同様にアルファベットの美的感覚が微妙には異なるはずなので、連中が問題ないからCJKも問題ないと思ったのかな、とは思う (ここらへんは文化
の結合度によるが、欧米ほど人が交流してれば美的感覚もそれなりに共有されてるのかもしれん) というか、具体的に言うと「骨」(0x9aa8)や「曜」(0x66dc)、これらは美的感覚ではなくモロに別形だが CJK統合漢字という根本的なとこから間違ってるよねと というかこれらが別コードとして登録されなかった理由は何なんだ?今更異体字ダーとかやってるのに http://mevius.5ch.net/test/read.cgi/tech/1723861080/430
431: デフォルトの名無しさん [sage] 2025/08/20(水) 21:08:26.58 ID:Qtedysji ん?2行連続空行は削除されるようになったのか? まあちと読みにくくなってるが、よろしく http://mevius.5ch.net/test/read.cgi/tech/1723861080/431
432: デフォルトの名無しさん [sage] 2025/08/21(木) 02:20:32.36 ID:X0ZtFPzr 一つ一つの技術を正しく理解していないから、文字通り「個人の感想ですよね」という まあ5ちゃんだし、酒飲み話みたいのもアリだとは思うけど 正しい知識が元になっていればそれは役に立つ話にもなる 一方読む方は間違いを間違いと見抜く力が.... って決してひろゆき信者ではないw http://mevius.5ch.net/test/read.cgi/tech/1723861080/432
433: デフォルトの名無しさん [sage] 2025/08/21(木) 02:56:06.57 ID:D3EzSAOJ 私も世界にSJISさえアレば良かった人間です(過去形)。欲しい文字は外字にドット打ってました。 ROMに第2水準程度しか乗っていない8ビットや16ビット世代のマシンでUTF8を構築するのって、現実的に可能なのかしら。 興味本位の疑問だけど。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/433
434: デフォルトの名無しさん [sage] 2025/08/21(木) 04:47:17.94 ID:HC849JP7 交換用符号としての扱いは楽だけど ROMのコードがJISだから変換マップをオンメモリにするのは厳しそう 索引付きでないと性能でないと思うから これもROMで持てるならあり もちろん幅や方向、合字なんかは扱えない http://mevius.5ch.net/test/read.cgi/tech/1723861080/434
435: デフォルトの名無しさん [sage] 2025/08/21(木) 05:18:08.01 ID:mNeC3fTJ >>433 そこはSJISとUTF8といった符号化方式の比較でなくてJIS漢字コードとユニコードの比較で十分 漢字ROMのデータ収録順序はJIS漢字コードの機械的変換できる範囲内だろうから ユニコードからJIS漢字コードへのマッピング http://mevius.5ch.net/test/read.cgi/tech/1723861080/435
436: デフォルトの名無しさん [sage] 2025/08/21(木) 05:33:29.34 ID:lFCpHxq7 いわゆる半角カタカナ等(JIS X 0201)と全角漢字等(JIS X 0208)のほとんどは規則的変換できるようにユニコード内に収容されている 例外は一部の記号や文字のみ したがって漢字ROM読み出しもほとんどは規則的変換できて例外のみ対応で実用的かな http://mevius.5ch.net/test/read.cgi/tech/1723861080/436
437: デフォルトの名無しさん [sage] 2025/08/21(木) 06:14:19.45 ID:BA9KDvPD 漢字は厳しいだろ 偶然だが半角の途中まではEF BDを前置するとUTF8 A1 。 EF BD A1 AF ッ EF BD AF B0 ー EF BD B0 B1 ア EF BD B1 B2 イ EF BD B2 B3 ウ EF BD B3 B4 エ EF BD B4 B5 オ EF BD B5 BF ソ EF BD BF http://mevius.5ch.net/test/read.cgi/tech/1723861080/437
438: デフォルトの名無しさん [sage] 2025/08/21(木) 08:42:01.26 ID:YIWSP+jR >>436 JIS/SJIS/EUC: https://manuals.ricoh.com/mfp/p_manual/MPC6004JPN/ja/intro/int/r_cjr041.htm unicode: https://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/cjku_klist.html さすがゆとりZ、無敵すぎ http://mevius.5ch.net/test/read.cgi/tech/1723861080/438
439: デフォルトの名無しさん [sage] 2025/08/21(木) 09:07:08.19 ID:4FAr+8B9 >>436 昔のAIにSJISをunicodeに変換するコード書かせたら何故かテーブルもってなくて機械的にシフトと論理演算で変換できますってコード出されたって話を思い出した お前、そのAIだったりしないか? http://mevius.5ch.net/test/read.cgi/tech/1723861080/439
440: デフォルトの名無しさん [sage] 2025/08/21(木) 16:15:00.95 ID:jm5fSTrV >>438 >JIS/SJIS/EUC: https://manuals.ricoh.com/mfp/p_manual/MPC6004JPN/ja/intro/int/r_cjr041.htm 区点コードで文字入力とはシブい。しかし字形が2004じゃないのは果たして マニュアルだけの話でプリントで使うフォントとかは別なのかな。にしても http://mevius.5ch.net/test/read.cgi/tech/1723861080/440
441: デフォルトの名無しさん [sage] 2025/08/21(木) 21:08:42.64 ID:YIWSP+jR >>440 何が言いたいのか分からんが、こちらの意図を明確にしておくと、 ただ単に「JIS 漢字表」でググって並び順が見やすいのを選んだだけ コードなら以下が見やすいかと http://www.infonet.co.jp/ueyama/ip/binary/x0208txt.html JIS等は漢字もあいうえお順(ricohのサイトはまんまアイウエオで見やすい) てかunicodeって何順? http://mevius.5ch.net/test/read.cgi/tech/1723861080/441
442: デフォルトの名無しさん [sage] 2025/08/22(金) 21:59:54.85 ID:SVHvHw/K https://www.asahi-net.or.jp/~ax2s-kmtn/ref/unicode/cjku_radical.html >UnicodeのCJK統合漢字は、概ね部首順(部首内は画数順)に並んでいます http://mevius.5ch.net/test/read.cgi/tech/1723861080/442
443: デフォルトの名無しさん [sage] 2025/08/23(土) 02:24:50.51 ID:/wnxORck しかしこれらの部首って、例のUnicodeの漢字部首のコードポイントに頼らなくても 出せるのね。元々各国の文字コードに部首のコードがあってそれがUnicodeに 引き継がれているようで JISでも第二水準にちょいちょい部首が入っている。冫(にすい)とか だがしかし「さんずい」や「しんにょう」などは第二水準にはない これって何故でしたっけ。まさか さんずい=水に「包摂」とか? ??? http://mevius.5ch.net/test/read.cgi/tech/1723861080/443
444: デフォルトの名無しさん [sage] 2025/08/23(土) 06:47:36.46 ID:0WleoknD >>443 氵も 辶 もJISにあるだろ (JIIS補助漢字または第4水準だが、包摂ではない) もちろん Unicode も部首素片以外に漢字側にも登録がある 冫だけ第2水準なのは教科書とかで使用例があったから(うろ覚え) http://mevius.5ch.net/test/read.cgi/tech/1723861080/444
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 18 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.015s