[過去ログ]
Fedora 総合スレッド Part 61 (1002レス)
Fedora 総合スレッド Part 61 http://mao.5ch.net/test/read.cgi/linux/1651250687/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
766: login:Penguin [sage] 2023/06/09(金) 14:04:53.47 ID:fYMZstLA >>756 それでもそれぞれが違う文字コードなんだから、なんてことない 問題なのはテキストデータに文字コードのメタデータを格納してないこと、それのみ みんな推測してテキストデータを開いてるから、おかしなことになる http://mao.5ch.net/test/read.cgi/linux/1651250687/766
770: login:Penguin [sage] 2023/06/09(金) 20:16:45.77 ID:f9JeOpZh ちと長くなるが。 >>767 まあ、その結論についちゃーある程度首肯もできるが… >>766についてはちょっと頷けない。 たとえばpython3なんかでは、SJIS系コードの古いファイルなんかを読み込もうとすると、エラーになってしまうことがある。 これはセキュリティが叫ばれるようになって(日本では、あくまでも叫ぶだけってところが泣けるが)堅牢性ってことが重視される ようになり、規格外のデータってのは扱うべきではない、ゆえに、言語側でエラーにしてしまおう、ということから 来るわけなんだが。 で、じゃあ、例えばバイナリで読んで、文字列に変換すれば、と思うとそれもできない。文字列に変換するときに、 しかるべきコーデックを指定しなければならないため、その際にコードがチェックされて、やっぱり規格外だから、 でエラーになっちゃう。 (まあ、俺のやりかたがわるいのかもしれないがw、それはそうだとしてもw) これは「規格」とはいわれても、なにが原因かは容易には分からんわ。 どの文字がおかしいのか、じゃあ、対応するコーデックはそもそもあるの?みたいな話になる。 で、こういう傾向は今後も強まるだろう。というか、もうオラは最新のスクリプト言語の傾向とかよー知らんから、 あれだけども、phpなんか既にこの傾向のようだし、Javaなんかも間違いなくこの口でしょう (perlだけはこっちには行かないと信じてるw) 昔のそもそもSJISハンドルしてるプログラムなんかは、今から見るとチョーあばうとな時代ですから、 少々おかしい文字なんか作成時にチェックとかしてないわさ?w そういうのハンドリングするのに、なんてことない、とはちょっとね… で、今後も>>756にあるような猿知恵かますやつはきっと出てくるよ? なんでもCで書けばえーやん、って話もあるだろうけど、それで満足とはちょっと言えんよね… で、だから構造化文書ってのも、こうなるとあんまり十分な解決策にはならんかな。 ちなみに自分は大事なデータはなるべくテキストにしている。やっぱりこれが一番プリミティヴだけに 読めなくなることがない。 今ではほとんどはemacsのorg-modeにしているので、保存時にコードチェックもされますんで、まあ 個人的にはその点だけは問題ないけど。 http://mao.5ch.net/test/read.cgi/linux/1651250687/770
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.035s