文字コード総合スレ part15 (462レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
342: デフォルトの名無しさん [sage] 2025/07/27(日) 10:52:09.39 ID:s52NuiMb >>341 ソース違いで自体が同じ例か? カと力は、何か変だと気づく程度には字形も微妙に違い、怪しい中華の説明書で間違って使われる程度だろ 問題になるのは全角チルダと波ダッシュとか、あと伸ばし棒も何種類かあって、 これらは日本人でも割とデタラメに使っているので、検索に引っかからなくなって困る だから、unicodeのCJK統合漢字=見た目が同じなら同じ文字、は、 検索の結果がユーザーにも予期出来る、という意味では正しい思想で、 逆に、同じ字体にも違うコードを割り付け、『ユーザーが正しくそれらを使い分けられない場合』、どうにもならなくなる この辺の思想が、unicodeは徹底出来ていない http://mevius.5ch.net/test/read.cgi/tech/1723861080/342
343: デフォルトの名無しさん [sage] 2025/07/27(日) 15:00:47.82 ID:xJMx5cyL >>340 そうじゃない PostScriptと当時のフォントの詳細をほとんど知らないだろ? だから妄想で適当なことを書く、酷いのはお前だ ってこのぐらい書けばわかるんかな http://mevius.5ch.net/test/read.cgi/tech/1723861080/343
344: デフォルトの名無しさん [sage] 2025/07/27(日) 15:43:44.47 ID:s52NuiMb >>343 PostScript以前はプリンタによって出力結果が異なっていた為、 ファイルを渡しても印刷結果が異なる事が普通だった (だから厳密にやるには紙でやりとりするしかなかった) これに対し、PostScriptだとどのプリンタでも見た目の出力結果が同じ為、 あっという間にデファクトスタンダードをとった PostScriptはベジエなフォントをプリンタでラスタライズする だからフォントを埋め込めば、同じ見た目の出力になる 以前のプリンタは、プリンタ内蔵のビットマップフォントを印刷してたか、 PCから送られてくるラスタデータを印刷してたかなので、環境によって印刷結果が異なっていた (なおその後PostScriptが若干落ち目なのは、特許料金が高いのと、 プリンタ上で処理する仕組み上、プリンタ側にそこそこのCPUが必要となり、プリンタ代が高くなるから) PDFはPostScriptをバイナリ化したものなので、基本思想はPostScriptから引き継いでいる 当時は(今もだが)WordもExcelも有料であり、その他のソフトも、全員が確実に持っている物はなかった AdobeはPDFの生成は有料だが、開くだけなら無料(AcrobatReaderは無料)という方針で、 あらゆる人に対して確実に読める環境を提示した為、PDFもあっという間に普及した MSがWord/Excelのリーダーを無料で提供したのはその後 俺が知ってる概略はこんな所だ PostScriptも、PDFも、当時としては素晴らしかったし、完全に機能してたよ (今でも十分素晴らしいとも思うが) ぼくはおまえよりしってるんだ!!!とか要らんから、最初から知ってる事書けばいいと思うけどね はいどうぞ http://mevius.5ch.net/test/read.cgi/tech/1723861080/344
345: デフォルトの名無しさん [] 2025/07/27(日) 16:00:29.88 ID:IiX+k+fy >PDFはPostScriptをバイナリ化したもの doubt http://mevius.5ch.net/test/read.cgi/tech/1723861080/345
346: デフォルトの名無しさん [sage] 2025/07/27(日) 16:39:24.93 ID:gwhcenFf PSはプログラム言語でPDFは描画データ 門外漢のオレの理解はここまで http://mevius.5ch.net/test/read.cgi/tech/1723861080/346
347: デフォルトの名無しさん [sage] 2025/07/27(日) 16:40:00.92 ID:s52NuiMb >>345 ああ確かに、asciiと言った方が近いようだな ただそんな関係ない所ではなく、本筋の、 > PostScriptと当時のフォントの詳細 に(自称)詳しい人から見て > 酷い と考える根拠を述べよ、だな 俺は、PostScriptもPDFも素晴らしかったから普及した、だから全く酷くない、と考える根拠を344で述べた 実際これで現在も機能してるんだから、文字コードの概念はPostScriptとPDFには不要だったという証明になってるし unicodeが色々おかしくしただけだよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/347
348: デフォルトの名無しさん [sage] 2025/07/28(月) 09:30:10.58 ID:BMbzFeOA https://www.adobe.com/jp/creativecloud/file-types/image/vector/ps-file.html PostScriptとPDFの違いは何ですか? PDFは、PSファイルの後継形式で、webと印刷の両方で最も広くサポートされているもののひとつです。ただし、PDFは表示形式であり、簡単には編集できませんが、PostScriptはプリンター制御言語であり、そのコード内でデザイン要件を伝達する機能があるため、印刷の可能性が広がります。 http://mevius.5ch.net/test/read.cgi/tech/1723861080/348
349: デフォルトの名無しさん [sage] 2025/07/28(月) 11:28:12.87 ID:2xoiUnVU postscript は紙に印刷する専用なので検索とかコピー・ペーストとかは不要だが PDF はディスプレイ表示を前提でそれらの機能がある。初期の PDF の仕様決める時に検索やコピペの国際化についての考慮が足りてなかった unicode が存在しなくても国際化が必要になったら同じ問題が起きて、PDF仕様の拡張が必要になってた 問題は単にPDFの仕様が膨らみ過ぎて全部実装するのが困難になってて、サブセットでしか実装していない不十分なアプリが氾濫し過ぎてるってだけ 直接的には文字コードの問題ではない http://mevius.5ch.net/test/read.cgi/tech/1723861080/349
350: デフォルトの名無しさん [] 2025/07/28(月) 13:24:28.88 ID:f/ONtylv ワニ□クリップも同じか http://mevius.5ch.net/test/read.cgi/tech/1723861080/350
351: デフォルトの名無しさん [sage] 2025/07/29(火) 12:35:56.91 ID:kq5k6q77 ちゃんと知らん奴に限って総括するような話をしたがるが、悲しいかな理解が 浅いので全然正しく総括できてないあるある これは例の何ちゃら効果の一種かもしれんね http://mevius.5ch.net/test/read.cgi/tech/1723861080/351
352: デフォルトの名無しさん [sage] 2025/07/29(火) 13:59:09.33 ID:3y9fqZXC 詳しく知らないと総括しかできない http://mevius.5ch.net/test/read.cgi/tech/1723861080/352
353: デフォルトの名無しさん [sage] 2025/07/29(火) 14:07:42.49 ID:OFHwVEwi WebでもHTMLのimgで例えばブランドロゴを画像表示したときに alt属性がなければテキストとして得られないがalt属性があればテキストとしても得られる そういう対応をきちんとするか否かでテキスト文字としてもコピペできるかどうか道が分かれる http://mevius.5ch.net/test/read.cgi/tech/1723861080/353
354: デフォルトの名無しさん [sage] 2025/07/29(火) 14:44:03.99 ID:GBwxra7f >>353 alt に対応してないメイン・ブラウザとかはほぼ存在しないんだが… PDF はなぁ… http://mevius.5ch.net/test/read.cgi/tech/1723861080/354
355: デフォルトの名無しさん [sage] 2025/07/29(火) 19:25:27.31 ID:8QmNUBAP HTMLは画像表示できずにテキスト表示のみの環境でも読めるように そして目の不自由な人たちもテキストの音声読み上げで読めるように HTMLコンテンツを作る側もブラウザ側両方が対応してきた いわゆるアクセスビリティ対応が必須で常識 PDFはその常識を欠いた者が対応を欠いたソフトを用いるとテキスト読み出し出来なくなる http://mevius.5ch.net/test/read.cgi/tech/1723861080/355
356: デフォルトの名無しさん [sage] 2025/07/29(火) 22:35:36.96 ID:pHNfVPjg altなんて実際のところ機能してないだろ 隠しメッセージに使うとかおもちゃになってる http://mevius.5ch.net/test/read.cgi/tech/1723861080/356
357: デフォルトの名無しさん [sage] 2025/07/31(木) 07:07:13.35 ID:1FIA24UI >>343 結局、何も言えないのか? だからゆとりZは死ねなんだな 俺は5chにいるゆとりZは全員殺処分が妥当だと考えてる 理由は長いが以下に書き散らしたので興味あれば読んでみてくれ https://mevius.5ch.net/test/read.cgi/tech/1739527246/529- お前らはお互いに足を引っ張り合ってるので成長出来てない 今回も、無駄に喧嘩を売ってきて、正面から受けてもだんまりとか、 だから議論もろくに出来ず、幼稚なままだ そもそも俺はPostScriptやフォントの事に一言も触れてないのに、どうして > PostScriptと当時のフォントの詳細をほとんど知らないだろ? > だから妄想で適当なことを書く、酷いのはお前だ になったのかさっぱり分からない ゆとりZは妄想で適当なことを書く、酷い連中だから 存在するだけで邪魔だし、議論も紛糾するだけなので、殺処分が妥当 お前も死ね ってこのぐらい書けばわかるんかな http://mevius.5ch.net/test/read.cgi/tech/1723861080/357
358: デフォルトの名無しさん [sage] 2025/07/31(木) 07:09:00.90 ID:1FIA24UI >>349 > 問題は単にPDFの仕様が膨らみ過ぎて全部実装するのが困難になってて、サブセットでしか実装していない不十分なアプリが氾濫し過ぎてるってだけ > 直接的には文字コードの問題ではない その通りだが、お前も感づいているとおり、間接的にはunicodeの問題だ 実際、フォントと文字コードが1:1対応してたSJIS等だと問題にならなかったのも事実だろ つまりunicodeが > 異端 (>>340:俺) で、 > 確実にどこかで破綻する気はする(か、そもそも実装してもらえないか) (>>336:俺) に現時点でなってるのも事実ではないか PDFに関してはパチもん使わずAdobe純正品使え、だろうが、 unicodeも十分複雑すぎる仕様だから、同様の状況(=フル実装されてないのが氾濫)になってる気はするが (だから足抜けは許さねえ!!!なコードヤクザになるのも納得) そもそもサロゲートペアも初段階で必須だと判断出来たはず (だからutf-16はナンセンスだとも) > https://skawa68.com/2024/07/31/post-81230/ 大漢和辞典で5万+、康熙字典で4.7万だから、ギリ行けると判断したのかもしれんが、 常識的には、いや無理でしょ、余裕無さすぎ、だし (よく知らんがハングルも1.2万程あるようだし、参考: https://tagengo-gakushuu.study-tips.info/app/web-form/korean/unicode_all_with_ancient_hangul/doc/all_hangul_chars_unicode.pdf) あとふと思ったが、IVS/IVD方式はもしかしてutf-32でも8バイトか? なら中国が独立コードに拘る理由もありえる、というか、 これだと事実上utf-32も捨てる事になる まあほぼutf-8なので今更どうでもいいのも事実だが http://mevius.5ch.net/test/read.cgi/tech/1723861080/358
359: デフォルトの名無しさん [sage] 2025/07/31(木) 07:55:06.21 ID:1FIA24UI 思うにunicodeは、文字化けのない世界を提示したのは素晴らしいにしても、 一つでやろうとするが故、仕様が包括的になるのは避けられず、破綻に向かっている気はする 全ての言語を話せる人が居ない以上、 IVS/IVDなんて欧米連中からすれば意味不明で、逆に欧米側の仕様は俺らには意味不明になる だから実装側は誰も仕様の妥当性を判断出来ず、ただひたすらに仕様に従うしかない これ自体は自治体向けや会計ソフト等、一般プログラマの領域外の分野では普通の事で、 だから橋渡しとして両方が分かる人を入れ、仕様でガチガチに固定するわけだが、 実際破綻しまくっているのも、元々無理があるからだ つまり、例のブランコ、 「顧客が本当に必要だったもの」を解決出来る人が、本質的に存在しない (会計等の分野なら、会計知ってる奴にプログラミングを教える、等の解があるが、 全ての言語を話せる人が存在しない以上、unicodeにはこの解が存在しない) まあIT版バベルの塔であり、どこまで行けるかという話だが 実際、自分には関係ない機能なんて、実装するモチベわかないものだし (大体において実際困ってるから動くのがほぼ全員で、困ってなければ誰も動かない この意味では、unicodeがフル実装される未来なんて多分存在しない) http://mevius.5ch.net/test/read.cgi/tech/1723861080/359
360: デフォルトの名無しさん [sage] 2025/07/31(木) 10:38:37.81 ID:Ztum1zAi >>359 気付いてないようだが unicode 以前の SJIS とかの時代から PDF では使うフォントによっては同じ問題が起きてた 変なフォント使うやつ少ないし、同じ国の中の文字の揺れなので気づくやつが少なかったのが、国際化の影響で別の国の文字だの部首素片だのに変換されて目立つようになっただけ PDF は文字コード表にない文字(フォント)まで扱えることを知ってればコピペ等で化ける(別の字への置き換え)は当然の仕様と知れる http://mevius.5ch.net/test/read.cgi/tech/1723861080/360
361: デフォルトの名無しさん [sage] 2025/07/31(木) 12:22:57.59 ID:1FIA24UI >>360 Windowsの標準のフォントしか使ってないので、遭遇した事もないし、聞いた事もないが (ただ、当時はそうなっても「文字化け」としてスルーされてたとも思うが unicodeしか使った事無いゆとり以降は、文字化け=バグ、とか言い出すから別の問題はあるにしても、 文字化けについて厳しくなってるから話題として出てきてるだけかもしれん) しかし結局、文字コード->グリフで多対一写像があり、戻す時にどちらに戻すべきか分からなくなるのが問題なら、 (SJISな当時に)多対一写像がありまくるのはただの糞フォントだとも思うが 平仮名/片仮名は漢字の簡易形であり、当然似たような字形はあるので、 ほぼ全部のフォントでそれらを何となく区別出来るように大きさを変えてあるのが常だし で、unicodeは多対一写像が仕様だから、 1:1写像な以前の世界向けに作られた物が当然誤動作してるだけだろ (さっさと対応しろよ、なのは勿論だが) して、「酷い」と考える奴は結局、後知恵でもいいからどうすべきだったと考えるのだ? 文字コードを埋め込む方式は、見た目同じだが検索に引っかからない、いわゆる正規化の問題が発生してしまう 同じグリフ->同じ文字コードなら、この問題は存在しない だから「検索」と「コピペ」のどちら向けの仕様にするか、であり、PDFが > 検索ができないのは不便だからってんで (>>328) なら、そりゃ検索向けの仕様にするよ (現在のPDFが検索時に正規化して対応してるとしても、 同じグリフに複数の文字コードを与えている糞フォントな場合、 画面なぞって検索したときに、見た目同じなのに引っかからないケースが発生する 同じグリフなら同じコードだ!の旧方式なら、これはない) http://mevius.5ch.net/test/read.cgi/tech/1723861080/361
362: デフォルトの名無しさん [sage] 2025/07/31(木) 12:57:26.17 ID:lEUWnalG 長文は読み手の負担になるし 希薄化して本当に書きたいことも伝わらなくなるよ http://mevius.5ch.net/test/read.cgi/tech/1723861080/362
363: デフォルトの名無しさん [sage] 2025/07/31(木) 13:09:41.59 ID:Ztum1zAi >>361 フォントが1種類しか使われてないと思い込んでるのがお前の妄想の原因なんだよ アラビア語のフォントが一部に使われてるPDFをSJISのテキストにコピペしたらどうなるか想像つくだろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/363
364: デフォルトの名無しさん [] 2025/07/31(木) 14:31:26.32 ID:hwCClOrU ∃〆レば良いんょ http://mevius.5ch.net/test/read.cgi/tech/1723861080/364
365: デフォルトの名無しさん [sage] 2025/07/31(木) 14:51:39.49 ID:1FIA24UI >>363 それはSJISの範囲を超えているから当然誤動作する (俺は知らんがwiki等読む限り)仕様としてはエスケープシーケンスで各国語を切り替えられたらしいが、 そんな事が必要な奴は90年代でも既にunicodeを使ってたので、 SJISに貼り付けて誤動作ガーとか言ってるお前が狂ってる 資本主義=商用ベースでやる以上、訳の分からないマイナーな使い方は無視されて当然 (良い悪いではなく、そうなる構造) http://mevius.5ch.net/test/read.cgi/tech/1723861080/365
366: デフォルトの名無しさん [sage] 2025/07/31(木) 15:58:32.58 ID:Ztum1zAi >>365 基本的な部分が分かってないな ・全ての文字(フォント)が SJIS と1対1でマップされている保証はない というのが ・全ての文字(フォント)が Unicode と1対1でマップされている保証はない というのに変わっただけで unicode など文字コードの問題だと思ってるのがお前の勘違い、文字コードで解決する問題ではない http://mevius.5ch.net/test/read.cgi/tech/1723861080/366
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 96 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
1.143s*