文字コード総合スレ part15 (470レス)
上
下
前
次
1-
新
387
(1)
: 08/02(土)12:26
ID:xIFE1Go+(4/4)
AA×
>>386
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
387: [sage] 2025/08/02(土) 12:26:25.37 ID:xIFE1Go+ >>386 相変わらず分かってねえな > コピペが化けるのと同じ問題が起きる だからいいんだぞ 両方ともPDF内から生成された物だからこそ、確実に一致する > PDFについて無知過ぎ PDF博士なお前はマウントポイントなこの点にこだわるようだが、 既に言った通り、本質的にはPDFではなくunicodeの問題だ 実際、unicodeなhtmlでも「見た目同じだけど検索に引っかからない」ケースが普通にあるだろ コピペに関しては、文字コードを保存してないのが問題で、既に仕様は追加済み、さっさと対応しろだが、 検索に関しては、元々unicodeは検索がまともに出来ない仕様で、それがPDFにも輸出されただけ 例えば、316で3つの「長」が同じグリフIDに紐づけされるのは、 当然その文書のそのフォントでは3つの「長」が同じグリフを使うからであり、見た目が同じだから 同じ文書をhtmlで表示させたら、当然画面上の見た目は同じ「長」になるが、 文字コードが3つのどれかは見た目では分からない だから「手打ちで」「長」と打ち込んでも、当たらない時がある これ、PDF全く関係ないだろ http://mevius.5ch.net/test/read.cgi/tech/1723861080/387
相変わらず分かってねえな コピペが化けるのと同じ問題が起きる だからいいんだぞ 両方とも内から生成された物だからこそ確実に一致する について無知過ぎ 博士なお前はマウントポイントなこの点にこだわるようだが 既に言った通り本質的にはではなくの問題だ 実際なでも見た目同じだけど検索に引っかからないケースが普通にあるだろ コピペに関しては文字コードを保存してないのが問題で既に仕様は追加済みさっさと対応しろだが 検索に関しては元は検索がまともに出来ない仕様でそれがにも輸出されただけ 例えばでつの長が同じグリフに紐づけされるのは 当然その文書のそのフォントではつの長が同じグリフを使うからであり見た目が同じだから 同じ文書をで表示させたら当然画面上の見た目は同じ長になるが 文字コードがつのどれかは見た目では分からない だから手打ちで長と打ち込んでも当たらない時がある これ全く関係ないだろ
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 83 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
ぬこの手
ぬこTOP
0.033s