文字コード総合スレ part15 (462レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
326: デフォルトの名無しさん [sage] 2025/07/24(木) 19:36:31.51 ID:Gx5EDFfz adobeはPDF2.0に対応したのか、やる気もないのか、とふと思った http://mevius.5ch.net/test/read.cgi/tech/1723861080/326
327: デフォルトの名無しさん [sage] 2025/07/24(木) 21:57:49.45 ID:PCIysLOC >>326 対応とは? PDF-2.0 が何か知ってて言ってるのか?↓ http://mevius.5ch.net/test/read.cgi/tech/1723861080/327
328: デフォルトの名無しさん [sage] 2025/07/25(金) 01:59:47.04 ID:UKTPcfYB PDFはPostScriptがベースなんだけど、これは元々プリンタ出力のために設計されたもの 後は紙に印刷するだけって状態のデータだから文字コードなんて概念はない PostScriptの仕様をPDFに流用する時、検索ができないのは不便だからってんで グリフ番号→文字コードのマッピング表をPDFファイルに埋め込める仕組みを作った アプリがこの表を適宜生成しないと文字化けが発生する http://mevius.5ch.net/test/read.cgi/tech/1723861080/328
329: デフォルトの名無しさん [sage] 2025/07/25(金) 07:07:21.05 ID:yWMF+wv2 >>328 それで、unicode以外ではグリフと文字コードが1:1だから問題にならなかったのなら、 アプリ製作者がunicodeについて無知なのが原因だろう ただ、unicodeも無駄に冗長すぎるようにも見える K(0x212a:Kelvin sign)とか、K(0x4b:大文字K)が今までの全ての文書で使われてるのに今更どうしろと? 今後「KをKに修正しろ」と誤字を指摘するKelvin警察が生まれるとウザい そして割と問題なのが、検索で引っかからなくなる事 検索時には区別しないのなら、最初から今まで通り同じフォントでよくね?だし unicodeが何を目指してどういう着地点を想定してるのかさっぱり分からん http://mevius.5ch.net/test/read.cgi/tech/1723861080/329
330: デフォルトの名無しさん [sage] 2025/07/25(金) 09:21:41.11 ID:5+UAzUxo >>329 元々の unicode は実践主義、御都合主義ともいう。 過去に別の文字として同時に実装された記録があれば別の文字として登録。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/330
331: デフォルトの名無しさん [sage] 2025/07/25(金) 11:08:12.46 ID:yWMF+wv2 >>330 つまり、あらゆる文字コードの上位セットにしてしまえば、文字コードを統一出来るとの考えか しかしこれだとあらゆる方言を内包する事になるので、おかしくなりかけてるのが今か どこかの自治体が「斉」の文字を外字で19種登録してたら、これもいつか実装されるというわけか (と思ったらもうあった、0x9f4a〜8文字のようだ) 仕様を適宜整理出来ず、ムダ仕様が膨らみ、メンテ不能になるのは、あるあるだけど、 unicodeもこの軌道に乗ってるな (もしかして欧米連中はこの辺の仕様の整理が上手くて、下手糞なCJKを混入したからおかしくなってるだけか?) http://mevius.5ch.net/test/read.cgi/tech/1723861080/331
332: デフォルトの名無しさん [sage] 2025/07/25(金) 14:05:16.33 ID:TViBdD0W >>331 戸籍/汎用電子情報交換環境/文字情報基盤の「斎」の変種のことなら unicode には IVD として全部登録されてる http://mevius.5ch.net/test/read.cgi/tech/1723861080/332
333: デフォルトの名無しさん [sage] 2025/07/25(金) 18:28:38.05 ID:yWMF+wv2 >>332 正式名称は知らんが、俺が言ってるのはそれだな ググったら総務省が音頭取ってやってるのか?色々出てきたが、 少なくとも規格化してから登録してるようだから、最低限の重複チェック等はあるはずで、まあ何とかなるのかな? にしても検索どうするんだこれ?だし、 最近の絵文字の氾濫も、当初の想定からかなり逸脱してるのではないかと思うが http://mevius.5ch.net/test/read.cgi/tech/1723861080/333
334: デフォルトの名無しさん [sage] 2025/07/25(金) 19:02:45.52 ID:yWMF+wv2 と思ったが、IVSは直後に枝番付加する方式か まあ、比較的マシ、というか、真面目にやるならこれしかない程度には洗練されてる ちなみにこれ、実際のグリフを算出するにはどうするのだ? 異体字が全部Exxxなようで、辞書引きするしかなく、それがIVDなのか? というか各者の説明読む限り、845B+E0100指定すれば勝手にそれが出てくる的な書き方で、 もしかして「斉」のようにunicode側に独立したコードを割り当てておらず、 必ず元字+枝番のセットで使うのが仕様か?(この方がいいが) http://mevius.5ch.net/test/read.cgi/tech/1723861080/334
335: デフォルトの名無しさん [sage] 2025/07/25(金) 19:10:28.15 ID:5+UAzUxo >>334 IVD は重複登録が許されてる。ソースが異なれば完全に同じ字形でも異なる IVS が与えられる(こともある) http://mevius.5ch.net/test/read.cgi/tech/1723861080/335
336: デフォルトの名無しさん [sage] 2025/07/26(土) 08:13:11.69 ID:PF0bui/v >>335 うむ、意図が分からん 「斉」は独立コ ードも与え、IVDにも登録、 「葛」は独立コー ドなし、IVDには登録、のようだから、仕様作ったやつが馬鹿だな 実装には結局両対応が必要となり、発注価格には1000万程度の上乗せが各社で必要となる 無能が仕様を作るとこういった糞仕様による目に見えづらい税金が発生するから、 仕様は最初にガッツリ決めようぜというのが欧米流だが、相変わらず日本はこの辺糞だな (大方やってるうちに足りなくなって途中で方針変更だろうが、これをやられると悲惨なことになる) > ソースが異なれば完全に同じ字形でも異なる IVS が与えられる(こともある) 検索でヒットする必要がなく、たまたま同じフォントで見た目が同じなだけだから、 プログラム側には全く問題ないだろうさ ただ、入力側が正しく入力できるかは大問題だろうけどさ 単一の文字コー ドを目指すかぎり、字体のみならず、コードの割り当て方の方言も内包することになるわけだな unicodeのバージョン管理って、完全上位互換?それとも後方互換切り捨て? (例:16準拠の場合、15を完全に満たすのか、そうでないのか) C#のように上手く古い仕様を廃止していかないと、確実にどこかで破綻する気はする(か、そもそも実装してもらえないか) http://mevius.5ch.net/test/read.cgi/tech/1723861080/336
337: デフォルトの名無しさん [sage] 2025/07/26(土) 12:33:33.50 ID:JK5RKkw3 >>336 最近の仕様だけ見たら混乱するよな − もともとは同じ文字の別字形については昔の資産(unicode が作られるより前の20世紀の文字コード)にある文字だけ独立したコードポイントが割り当てられる方針だった − その後の他の字形も使いたい、実際に使ってる現場があるという要望に答えるために IVS が整備された − でもある文字と別の文字の字形が同じかどうかをフォント抜きで確実に判別する手段がないので字体表をそのまま IVD として登録していく方針にした − 中国政府が「 IVD とか知るか、独立したコードポイント割り当ててくれないんなら、自分たちで勝手に割り当ててオレオレ unicode の利用を中国国内では強制することにするがよろしいか?」 と言い出した − unicode 側が折れて漢字に関しては中国が要望してきた分に関してはIVDじゃなくて今後も全部に独立コードポイントが割り当てられることになった − 甲骨文字は漢字じゃないので独立コードポイントよこせって中国が言ってきたので漢字とは別に割り当てる予定 http://mevius.5ch.net/test/read.cgi/tech/1723861080/337
338: デフォルトの名無しさん [sage] 2025/07/26(土) 13:22:34.55 ID:IhScHI/D >>337 日本側の状況はさもありなん 全自治体の異体字をカバーする為にはIVS/IVDしかないので、最初からここを目指せればベストだったが 中国側の言い分は正直分からん、というか連中は日本政府以上に馬鹿だな 検索考えたらIVS/IVD方式の方が独立コード方式より断然いいのに とはいえ状況知らんが、簡体/繁体もある意味異体字だから、最早どうしようもないのかもしれんが > オレオレ unicode の利用を中国国内では強制することにする それは中国規格なので勝手にしろでいいと思うが > unicode 側が折れて となるのは、unicode陣営は統一コードの夢を見続けている、ということか なら、日本政府が、どうにもならないからやっぱ止めて新規格作ります、とか言いだしたら、(見る限りこの必要はないと思うが) 非関税障壁ガーで、足抜けは許さないコードヤクザになるわけだな まあ、検索考えたら独立コードになってるのも全部IVS/IVD方式に寄せた方がいい 現実的には入力後に独立コード→IVS/IVDに変換してDB登録すれば実害はあまりない 可能であればさっさと独立コードになってる物を仕様から落とすべきだが、これは難しいのだろうね http://mevius.5ch.net/test/read.cgi/tech/1723861080/338
339: デフォルトの名無しさん [sage] 2025/07/27(日) 09:27:25.30 ID:y0cxqRG2 >>328 >PDFはPostScriptがベースなんだけど、これは元々プリンタ出力のために設計されたもの >後は紙に印刷するだけって状態のデータだから文字コードなんて概念はない これはひどい http://mevius.5ch.net/test/read.cgi/tech/1723861080/339
340: デフォルトの名無しさん [sage] 2025/07/27(日) 09:52:00.68 ID:s52NuiMb >>339 酷くはない その当時はそれでも素晴らしかったから普及した そして実際、unicode以前は完全に機能していたわけだし どちらかというとunicodeが既存技術に対してかなり異端で、 当然アプリは別対応が求められるが、それが適切に為されていない場合、誤動作してるだけ Adobe謹製環境では動作してるのなら、Adobe側がこれ以上できることはない http://mevius.5ch.net/test/read.cgi/tech/1723861080/340
341: デフォルトの名無しさん [] 2025/07/27(日) 10:08:59.26 ID:4jy4lfp7 >>336 単純な例で カ と 力 だな こんなの一緒にされたら困る http://mevius.5ch.net/test/read.cgi/tech/1723861080/341
342: デフォルトの名無しさん [sage] 2025/07/27(日) 10:52:09.39 ID:s52NuiMb >>341 ソース違いで自体が同じ例か? カと力は、何か変だと気づく程度には字形も微妙に違い、怪しい中華の説明書で間違って使われる程度だろ 問題になるのは全角チルダと波ダッシュとか、あと伸ばし棒も何種類かあって、 これらは日本人でも割とデタラメに使っているので、検索に引っかからなくなって困る だから、unicodeのCJK統合漢字=見た目が同じなら同じ文字、は、 検索の結果がユーザーにも予期出来る、という意味では正しい思想で、 逆に、同じ字体にも違うコードを割り付け、『ユーザーが正しくそれらを使い分けられない場合』、どうにもならなくなる この辺の思想が、unicodeは徹底出来ていない http://mevius.5ch.net/test/read.cgi/tech/1723861080/342
343: デフォルトの名無しさん [sage] 2025/07/27(日) 15:00:47.82 ID:xJMx5cyL >>340 そうじゃない PostScriptと当時のフォントの詳細をほとんど知らないだろ? だから妄想で適当なことを書く、酷いのはお前だ ってこのぐらい書けばわかるんかな http://mevius.5ch.net/test/read.cgi/tech/1723861080/343
344: デフォルトの名無しさん [sage] 2025/07/27(日) 15:43:44.47 ID:s52NuiMb >>343 PostScript以前はプリンタによって出力結果が異なっていた為、 ファイルを渡しても印刷結果が異なる事が普通だった (だから厳密にやるには紙でやりとりするしかなかった) これに対し、PostScriptだとどのプリンタでも見た目の出力結果が同じ為、 あっという間にデファクトスタンダードをとった PostScriptはベジエなフォントをプリンタでラスタライズする だからフォントを埋め込めば、同じ見た目の出力になる 以前のプリンタは、プリンタ内蔵のビットマップフォントを印刷してたか、 PCから送られてくるラスタデータを印刷してたかなので、環境によって印刷結果が異なっていた (なおその後PostScriptが若干落ち目なのは、特許料金が高いのと、 プリンタ上で処理する仕組み上、プリンタ側にそこそこのCPUが必要となり、プリンタ代が高くなるから) PDFはPostScriptをバイナリ化したものなので、基本思想はPostScriptから引き継いでいる 当時は(今もだが)WordもExcelも有料であり、その他のソフトも、全員が確実に持っている物はなかった AdobeはPDFの生成は有料だが、開くだけなら無料(AcrobatReaderは無料)という方針で、 あらゆる人に対して確実に読める環境を提示した為、PDFもあっという間に普及した MSがWord/Excelのリーダーを無料で提供したのはその後 俺が知ってる概略はこんな所だ PostScriptも、PDFも、当時としては素晴らしかったし、完全に機能してたよ (今でも十分素晴らしいとも思うが) ぼくはおまえよりしってるんだ!!!とか要らんから、最初から知ってる事書けばいいと思うけどね はいどうぞ http://mevius.5ch.net/test/read.cgi/tech/1723861080/344
345: デフォルトの名無しさん [] 2025/07/27(日) 16:00:29.88 ID:IiX+k+fy >PDFはPostScriptをバイナリ化したもの doubt http://mevius.5ch.net/test/read.cgi/tech/1723861080/345
346: デフォルトの名無しさん [sage] 2025/07/27(日) 16:39:24.93 ID:gwhcenFf PSはプログラム言語でPDFは描画データ 門外漢のオレの理解はここまで http://mevius.5ch.net/test/read.cgi/tech/1723861080/346
347: デフォルトの名無しさん [sage] 2025/07/27(日) 16:40:00.92 ID:s52NuiMb >>345 ああ確かに、asciiと言った方が近いようだな ただそんな関係ない所ではなく、本筋の、 > PostScriptと当時のフォントの詳細 に(自称)詳しい人から見て > 酷い と考える根拠を述べよ、だな 俺は、PostScriptもPDFも素晴らしかったから普及した、だから全く酷くない、と考える根拠を344で述べた 実際これで現在も機能してるんだから、文字コードの概念はPostScriptとPDFには不要だったという証明になってるし unicodeが色々おかしくしただけだよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/347
348: デフォルトの名無しさん [sage] 2025/07/28(月) 09:30:10.58 ID:BMbzFeOA https://www.adobe.com/jp/creativecloud/file-types/image/vector/ps-file.html PostScriptとPDFの違いは何ですか? PDFは、PSファイルの後継形式で、webと印刷の両方で最も広くサポートされているもののひとつです。ただし、PDFは表示形式であり、簡単には編集できませんが、PostScriptはプリンター制御言語であり、そのコード内でデザイン要件を伝達する機能があるため、印刷の可能性が広がります。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/348
349: デフォルトの名無しさん [sage] 2025/07/28(月) 11:28:12.87 ID:2xoiUnVU postscript は紙に印刷する専用なので検索とかコピー・ペーストとかは不要だが PDF はディスプレイ表示を前提でそれらの機能がある。初期の PDF の仕様決める時に検索やコピペの国際化についての考慮が足りてなかった unicode が存在しなくても国際化が必要になったら同じ問題が起きて、PDF仕様の拡張が必要になってた 問題は単にPDFの仕様が膨らみ過ぎて全部実装するのが困難になってて、サブセットでしか実装していない不十分なアプリが氾濫し過ぎてるってだけ 直接的には文字コードの問題ではない http://mevius.5ch.net/test/read.cgi/tech/1723861080/349
350: デフォルトの名無しさん [] 2025/07/28(月) 13:24:28.88 ID:f/ONtylv ワニ□クリップも同じか http://mevius.5ch.net/test/read.cgi/tech/1723861080/350
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 112 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.015s