文字コード総合スレ part15 (410レス)
文字コード総合スレ part15 http://mevius.5ch.net/test/read.cgi/tech/1723861080/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
375: デフォルトの名無しさん [sage] 2025/08/01(金) 08:03:21.63 ID:S37h8L9Z >>373 SJIS の話してんのに unicode 関係ないだろ お前は PDF のこと全く分かっってないだろ PDF はお前が思ってるほど単純なしくみじゃないぞ CMap って聞いたことあるか? そのあたりから内部構造勉強してみ /ActualText どころか ToUnicode CMap すらない PDF だって普通にあるんだよ(unicode 以前のフォントが unicode 対応してる訳ないだろ PDFの内部の文字の記録は unicode ではなくてグリフID というフォント内の格納番号なんだよ、一部の日中韓フォント使った場合は CID というまた別のコードで記載されてることもある http://mevius.5ch.net/test/read.cgi/tech/1723861080/375
376: デフォルトの名無しさん [sage] 2025/08/01(金) 08:41:40.71 ID:wR/jTASQ >>375 その辺は316のリンク先読んだ程度しか知らないが、 それでも普通にプログラミング経験があれば理解出来る物なんだよ グリフID->文字コードの変換表は、普通に実装すれば「その文書で最初にそのグリフを使った文字コード」が格納される だから、「違う文字コードだが同じグリフ」が無い場合、この程度の仕様/実装でも検索もコピペも問題ない 実際、SJISでWindowsデフォのフォントを使ってる限り、問題なかった ところがunicodeでは、「違う文字コードだが同じグリフ」が普通にあるので、 コピペでは「同じグリフの違う文字コード」に変更(縮退)されてしまう事が多発する なお、PDF内では「同じグリフは同じ文字コード」に縮退されているので、検索では100%ヒットする というか、ループしてるしこの辺でいいか? ここでは知識(知れば済む事)を与える事は出来ても、 理解(考えて納得する事)を与える事は出来ない いろんな言い方をする事は出来るけども、既にそうしてきてるし、 これで理解出来ないのはお前の知能の問題で、ここで一朝一夕に修正するのは無理だ お前は知識=頭がいいと考える文系馬鹿に近い存在のようだが、それは間違いだ 知識はちゃんと理解してナンボであってね プログラミングが多少でも出来る奴なら、上記の俺の説明で、ああ、はいはい程度には理解出来ると思うし http://mevius.5ch.net/test/read.cgi/tech/1723861080/376
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.027s