文字コード総合スレ part14 (786レス)
1-

1
(1): 2023/03/03(金)15:46 ID:yKqwMGHT(1) AAS
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 2chスレ:tech
文字コード総合スレ part2 2chスレ:tech
文字コード総合スレ part3 2chスレ:tech
省13
767: ランベルト星人 04/29(月)19:42 ID:V3l6c++H(15/15) AAS
elseif 🟦<224 then '2byte
  if 128≦🟫≦191 then
    ⭐=64*(🟦-192)+(🟫-128)
    UNICHAR(⭐)を表示
    n=n+2

で、当ロジックは🟦≧192のときに実行される。
故に実質

if 192≦🟦<224 then '2byte
  if 128≦🟫≦191 then
    ⭐=64*(🟦-192)+(🟫-128)
省6
768
(1): 04/29(月)19:43 ID:VwlqwQ1k(1) AAS
CSVやTSVでセル内改行ができない問題は
行の区切りを改行文字ではなくRSやVTにすれば解決しそうだがその方法で問題あるだろうか
769: 04/30(火)05:42 ID:6q3HkpC/(1/13) AAS
そういえば、エクセルの、ある一つ、一つの、ひとつの、
セル内で文字列[xxxxyyyy]を改行は、
オペレーション的には
xxxx [ALT]+[改行] yyyy だったような。

地球の書によると、Lf(ASCIIコード10 スナワチ0x0a)だ。

CSVでセル内改行不能問題は、知らん。失礼m(_ _)m
ちな、ンゴ文字をセル内に入れる、文字の表示方向が
逆になったりする事が、よくある。

それは、バグでなく仕様の可能性、かと憶測する。
なお、数字を入れると、右詰めになり、
省4
770: ランベルト星人とプロマネ 04/30(火)09:07 ID:6q3HkpC/(2/13) AAS
👤 PRINTABLE:=C0=80 で👻と表示、ヤバ。バグなのか?
☕ ま、いいんぢゃなーーい
🤡 SONYさんのスマホのCNTACTS.VCFはヌル文字なんて入力不可
  また、半角数字は123なら =31=32=33 と出力だ
  2バイトには変換しないので、
  そんな不正なコードは出力しませんよーーー
  だから、ASCiiは、=C0=B8 なんて出力しません
☕  レビューやーめたーーーー
771: ランベルト星人の呟き 04/30(火)10:09 ID:6q3HkpC/(3/13) AAS
ある文字が、UTF8で絶対に絶対に絶対に2BYTE文字の場合、
その下限てか上限は、=C2=80 だ
てか、UTF8で0xC280はなんて文字なんだろうか

🤡知らん。けど、変な文字だろ
電話帳にそんなコードは入力しないからどうでもよいので

🥳ポクのスマホの連絡帳てか電話帳の氏名に
絵文字入れても、バッチリ。ツールバッチリ
絵文字とASCII文字だけバッチリなら
他の文字は使用しないから、ツール問題なし
てか、絵文字以外かつASCii以外の文字の
省6
772: 04/30(火)10:23 ID:6q3HkpC/(4/13) AAS
ランベルトとかいう、宇宙人の落ちこぼれが
UTF8 C280 つまりU+0080がどんな文字が
疑問に思ってるようだ。
どうやら、極めて怪しい制御コードのような
霊感を感じる。それのお絵描きしておく

BY ☕ジャバ星人でしたーーーー
sssp://o.5ch.net/233fk.png
773: 04/30(火)10:39 ID:6q3HkpC/(5/13) AAS
xxx ❓❓❓ PAD だろ xxxはとPADとは全く違う by 👤
xxxは未知だから、PADとかいのでもいいんぢゃない by 🤡
xとPは違う文字である。この2人目がヤバイ by 🥳
774: バカテスター 04/30(火)11:12 ID:6q3HkpC/(6/13) AAS
🥳 それは、Padding Character というヤツ
モチロン、非表示の文字らしいです。
だから、Spaceで、表示すべきです。
xxx とか PAD と表示してるサイトが
多々見受けられる。バグですね。ーー

BY 🥳発達障害が更に悪化中
775: ランベルト星人等 04/30(火)11:20 ID:6q3HkpC/(7/13) AAS
ちぇっ、👻表示させたかな。by 👤
そんな文字はスマホに入力できないので、
そんな文字をデコードしたのはcontacts.vcfに存在しないので
リリース済のは、修正しませーーーん by 🤡
え、リリース済❓👤
デヘヘ🤡
776: JAVA星人 04/30(火)15:27 ID:6q3HkpC/(8/13) AAS
オレッちがソースレビューさせれば、以下のようにするのになあ

elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte

は、
elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<194then 'なんちゃって2byte
省4
777
(1): ランベルト星人 04/30(火)15:35 ID:6q3HkpC/(9/13) AAS
緊急PGメンテかよ。ま、
elseif 🟦<192then 'なんちゃってascii
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte

は、
elseif 🟦<194then 'なんちゃってUTF8
  「👻」を表示
  n=n+1
elseif 🟦<224 then '2byte
省10
778: バカテスター 04/30(火)15:46 ID:6q3HkpC/(10/13) AAS
>>777 の緊急PG修正ってコメント除けば
一文字修正するだけぢゃーーーん

❌ elseif 🟦<192then 'なんちゃってascii
⭕ elseif 🟦<194then 'なんちゃってUTF8

192を194にするだけ。1秒で修正するぢゃーーーん

プロマネとか自称宇宙人ってバカなの❓

BY 🥳超バカテスターに成りすましてみたー
779
(1): ランベルト星人 04/30(火)16:26 ID:6q3HkpC/(11/13) AAS
👤再リリース完了 🤡Good job ☕ま、やらかすと思ったわ 

👤UTF8では、最初の1バイト目が1100 が2byte なんて地球の書に釣られた
☕そっか、かつてのオレを思い出した
👤んー❓
☕2BYTE⇒1100 xxxx xxxx xxxx  は真か偽だな。
👤地球人には無理だろ。偏差値パワーが有限だからな地球人は
☕オレはかつて地球人だった。オマエも地球人に格下げ寸前だったな 

🤡C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTEって 
地球の書に記載した方がいいか?

👤☕ それは正解だが、反例らしき忖度に満ちた地球の書に
省4
780: あっいけね 04/30(火)16:29 ID:6q3HkpC/(12/13) AAS
>>779
❌C0 00 〜 C0 7F は、UTF8 ではなんちゃって2BYTE
⭕C0 00 〜 C2 7F は、UTF8 ではなんちゃって2BYTE
だった。他にもたくさん、ミスってそう。(⁠ ⁠・ั⁠﹏⁠・ั⁠)
781: 編集後記 04/30(火)18:21 ID:6q3HkpC/(13/13) AAS
👤プロマネよ。あのさ、ナンデ、UTF8文字列→UNICODE文字列 なんてプログラミングをオレにさせたんだ?
🤡それがさ、6年前の春は、その当時で古いスマホの電話帳
を、その当時で新しいスマホに、vcfファイル経由でコピーしたことに遡る。
👤6年前時点の古いスマホなら、android4.x新しいのなら、android8頃か
🤡んー、多分yes
🥳バージョンが古いから、vcfファイルも、モピロン、文字化けだよね。
🤡いや、vcfを当時のパソコンで開くとちゃんと氏名等の漢字は読める。平文だ
 その頃はwin8.1のヤツを使用してた。
👤vcfは漢字も平文で読めたのか
🤡yes その当時は。
省10
782: 05/01(水)00:33 ID:T3vg4v9s(1) AAS
>>768
>CSVやTSVで、セル内改行ができない問題は

Ruby ではクォート文字で囲めば、
行区切り文字・列区切り文字・クォート文字も、データ内に入れられる

require 'csv'

input = <<"EOT"
"a""a","b,b",あ
"c
c","d\nd"
EOT
省9
783: 05/01(水)05:45 ID:ksHbXVNI(1/3) AAS
ん、微妙に話しズレるが、新たなるプロジェクト思いついた
・VBAでcontacts.csvをバイナリで読み込ませる
・CR LF などそれが2バイトでも全てLF1byteに変換する
・それをセルの んー例えばC3セルに表示
・C3セルの一つだけのセルに、contacts.vcfが表示される
・とにかく、vcfのエンコードツールをvbaで開発する
by 🤡

それより、プロマネ、プリンタかってーーー
ネットプリントめんどくせー
by 🥳👤
省1
784: ジャバ星人の呟き 05/01(水)20:43 ID:ksHbXVNI(2/3) AAS

2BYTE⇒1100 xxxx xxxx xxxx の最小値って地球人よ知ってるか❓
16進で、xC000 だぜ。もし、xC280にしたいならさ、
それを簡易に表現できるパワーが必要だろ。
やたら、言い訳した内容を補足に入れてもよ。
そんなの、理解できねーーーってワケ

by ☕

でさ、なんで自称宇宙人のチミはジャバ星人って自称してるの
by 👤ランベルト星人

んーーー by☕
省5
785: プロマネの呟き 05/01(水)21:00 ID:ksHbXVNI(3/3) AAS
ジャバ星人(サンマイクロシステ⚪星人)と、ランベルト星人の
やり取り、意味深だな。
てかさ、ISO/IEC 10646 [ISO.10646] に
UTF8toUNICODE の極めて具体的なアルゴリズムが
英文で記載されてる。

モピロン、ランベルト星人やジャバ星人が開発したのは
その通りに作ってるハズだろ。

地球人の規格か概ね上位互換だ てかそれキニシナイ BY 👤
今の規格でも何か怪しい てかもぅゴリゴリだせを BY ☕

あのさ、ジャバ星人は地球からスピンアウトしたら BY 初登場のミラクル星人
786: ジャバ星人 05/02(木)14:20 ID:cxxyFm3G(1) AAS
オラ、いや、ミラクル星人にはナイショだけどよ、
ランベルトとかいう宇宙人の、自称秘伝の数式
⭐=64*(🟦-192)+(🟫-128) ※UTF8で2byte専用
で⭐が127以下になる全ての🟦、🟫の非負整数解って
ま、地球人でも厨房程度の低知能で解けるだろ。

見え貼ってビット積とか使って規格書記載してるから
数式の連立方程式すら失念し、重複するだってワケ
地球人って、地球🌏の中ぢゃ、知能はマシだが、
この宇宙の中ぢゃ、もう恥ずかしくて、宇宙旅行なんて出来ないだろ
by ☕
省8
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 1.562s*