【Perlフレームワーク】Catalystを語る人 (261レス)
上下前次1-新
167: 2011/05/29(日)02:58 ID:??? AAS
PerlやPythonの多言語処理は、内部の文字列エンコーディングがUTF8(UTF16)と決まってるんだから、UTF8フラグと呼ぶのは正しい。
168(1): 2011/05/29(日)03:53 ID:??? AAS
UTF8はASCIIコードと互換性があるのだから
文字数を数えるとか以外では
区別する必要がないんだよ。
つまりUTF8ならバイト列として処理して構わない。
それなのにいちいち変なフラグつけるなと。
169: 2011/05/29(日)11:29 ID:??? AAS
>>165
じゃw_char型ってなんのためにあるの?
>>166
UTF8って表現は俺も意味わからん。
Unicodeフラグの方が正しい
>>168
お前みたいのが迷惑なコード書き散らすんだよ。
170(1): 2011/05/29(日)11:39 ID:??? AAS
Perlの内部表現はUTF8なんだからUTF8フラグと呼ぶのは正確。decode()してエンコードがUTF8であると決定されるんだから。
171: 2011/05/29(日)22:30 ID:??? AAS
>>170
内部表現はUnicode(多分w_char)だよ。¥x{FFFF}とかにフラグ立てられるっしょ。
172(1): 2011/05/30(月)00:14 ID:??? AAS
w_charは2バイト限定。
UTF8は1〜6バイト
Unicodeはただの文字集合。内部表現じゃない。
そんなこともしらんのか
173(1): 2011/05/30(月)00:23 ID:??? AAS
>>172
Unicodeのコードポイント0x0000-0xffffをw_charに
突っ込んでるのがPerlの内部表現って意味だけど?
174(1): 2011/05/30(月)00:28 ID:??? AAS
1〜6バイトの可変長文字列を内部表現にしたら扱いにくくて
仕方ないだろjk。
175: 2011/05/30(月)00:30 ID:??? AAS
文字列->バイト列な
176(1): 2011/05/30(月)00:34 ID:??? AAS
>>173
Unicodeのコードポイントは0x0000から0x10FFFFだ
16ビットに入りきるかボケ
177: 2011/05/30(月)00:35 ID:??? AAS
>>174
ASCII互換にすることで
扱いやすくしているのを知らんのか。
ASCII互換の意味調べてから出直してこい。
178(1): 2011/05/30(月)00:48 ID:??? AAS
>>176
外部リンク[pod]:perldoc.jp
内部表現はutf-8かも知れないし、違うかもしれないし
プログラマは気にしちゃダメってことだな。
179(1): 2011/05/30(月)00:58 ID:??? AAS
>>178
latin-1かUTF8って書いてあるだろ。
それ以外じゃねーよ。
勉強になったか、初心者よ。
180: 2011/05/30(月)01:01 ID:??? AAS
>>179
俺関係ないし。
将来的に変わるかもしれないからプログラマは内部表現に
依存すんなってことでしょ?
181(1): 2011/05/30(月)01:04 ID:??? AAS
内部表現はUTF8と書いてある以上
UTF8だ。
182: 2011/05/30(月)01:06 ID:??? AAS
>>181
Perl の内部表現の一つはたまたま UTF-8 です。 残念ながら、
Perl は秘密を守れないので、このことはみんな知っています。
これが多くの混乱の源です。 内部表現は何か分からないエン
コーディングで、常に明示的にエンコードと デコードが必要
ということにしておいた方がよいです。
183: 2011/05/30(月)01:06 ID:??? AAS
ってことで命名が悪かったんだよ。
184: 2011/05/30(月)19:04 ID:??? AAS
Rubyみたいに内部表現のエンコーディングが任意な言語なら別だが、Perlの内部表現はUTF8で固定されてるのでUTF8フラグという呼称になる。
185(1): 2011/06/02(木)03:58 ID:??? AAS
問題は、UTF8フラグありのUTF8文字列と
UTF8フラグなしのUTF8文字列があるということ。
どっちを使うべきか?
はっきりしているのはPerlよりも外に出力するときには
UTF8フラグは無しにするということ。
186: 2011/06/02(木)13:29 ID:??? AAS
>>185
>問題は、UTF8フラグありのUTF8文字列と
> UTF8フラグなしのUTF8文字列があるということ。
へえーUTF8フラグなしの文字列があるのか。
UTF8フラグなしはバイト列だと思うがな。
上下前次1-新書関写板覧索設栞歴
あと 75 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.012s