[過去ログ]
文字コード総合スレ part14 (1002レス)
文字コード総合スレ part14 http://mevius.5ch.net/test/read.cgi/tech/1677826018/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
リロード規制
です。10分ほどで解除するので、
他のブラウザ
へ避難してください。
18: デフォルトの名無しさん [sage] 2023/03/05(日) 17:10:12.27 ID:C3C6IsZE >>15 「BOM が不要の場合は先頭の U+FEFF は後方互換性のために ZWNBS として扱う」と規定には書かれいる。 http://mevius.5ch.net/test/read.cgi/tech/1677826018/18
72: デフォルトの名無しさん [sage] 2023/03/07(火) 13:25:15.27 ID:fx05/qep お前が書き込むな http://mevius.5ch.net/test/read.cgi/tech/1677826018/72
221: デフォルトの名無しさん [sage] 2023/05/10(水) 12:49:42.27 ID:ji6HZ6my >>220 今どき手書きしない。 ここ20年くらい住所氏名電話番号くらいしか手書きした覚えないなあ。あとは問診票の体温とかか http://mevius.5ch.net/test/read.cgi/tech/1677826018/221
339: デフォルトの名無しさん [sage] 2023/06/25(日) 19:53:24.27 ID:s5vVSYDk ぼくは雑誌コード http://mevius.5ch.net/test/read.cgi/tech/1677826018/339
507: デフォルトの名無しさん [sage] 2023/12/19(火) 23:28:13.27 ID:39X2u1HU それだけあれば十分だな! http://mevius.5ch.net/test/read.cgi/tech/1677826018/507
686: 備忘録but厳密さは低い [] 2024/04/22(月) 17:34:03.27 ID:K/eQNJGk てか😅 1111 1111 = 255 = FF 0111 1111 = 127 = 7F だFFと7Fは違うといというか、カテゴリー何バイトにするのか はやく、設計決めろーーちゅーーーの http://mevius.5ch.net/test/read.cgi/tech/1677826018/686
694: ランベルト星人 [] 2024/04/23(火) 08:45:19.27 ID:4WFWNNQf 👤 コラ、プロマネよ。チミの数式一発のやつ カテゴリ3バイトのでも、99%超の確率でダメだ。 霊感どころか、直感もないダメ数式ですよーーー やはり、カテゴリ3のほぼ99%以上(霊感では100%)について 下記の、超秘伝の数式でバッチリなのぢゃ 🟦1byte目のUTF8の10進数 トスル 且つ 🟫2byte目の それだ トスル 且つ 🟪3byte目の ぢゃ トスル スルト、 ⭐ = 256*(16*(🟦-224)+INT((🟫-128)/4)) +64*(MOD((🟫-128),4)) +(🟪-128) というランベルト星の秘伝の数式により ⭐には地球人が発明したUTF8の10進数をゲットぢゃ なお、霊感では、多分全てのカテゴリー3の文字で成立のありがたい数式ぢゃ 🥳 プロマネダメぢゃーーーーん。霊感に頼るからだよん てかランベルト、やるぢゃーーん。霊感バッチリぢゃーーん、 👤 いや、霊感というか地球の書をやっと理解して後は、ま霊感ぢゃ http://mevius.5ch.net/test/read.cgi/tech/1677826018/694
731: プロマネみずからプログラミング設計 [] 2024/04/25(木) 15:42:21.27 ID:Zr256XUh PRINTABLE:=xx=xx=xx=xx=xx=xx なんて感じのやつは、1バイト先はその3倍右だな by 🤡呟き http://mevius.5ch.net/test/read.cgi/tech/1677826018/731
783: デフォルトの名無しさん [] 2024/05/01(水) 05:45:14.27 ID:ksHbXVNI ん、微妙に話しズレるが、新たなるプロジェクト思いついた ・VBAでcontacts.csvをバイナリで読み込ませる ・CR LF などそれが2バイトでも全てLF1byteに変換する ・それをセルの んー例えばC3セルに表示 ・C3セルの一つだけのセルに、contacts.vcfが表示される ・とにかく、vcfのエンコードツールをvbaで開発する by 🤡 それより、プロマネ、プリンタかってーーー ネットプリントめんどくせー by 🥳👤 プロジェクトは延期ーー 🤡 http://mevius.5ch.net/test/read.cgi/tech/1677826018/783
788: デフォルトの名無しさん [sage] 2024/05/04(土) 01:03:55.27 ID:Lsoig7U/ VTも使うTSV形式はこんな感じか。 行末のCRLFは無くても問題ないが あった方がテキストエディタで開いた時に見やすくなる セルA1␉セルB1␉セルC1␋␍␊ セルA2␉セルB2␉セルC2␋␍␊ ASCIIが想定していたUSやRSの使い方はこんな所だろうか セルA1␟セルB1␟セルC1␞␍␊ セルA2␟セルB2␟セルC2␞␍␊ http://mevius.5ch.net/test/read.cgi/tech/1677826018/788
826: デフォルトの名無しさん [sage] 2024/06/07(金) 20:02:28.27 ID:f1gRwXGz Ruby では、 https://qiita.com/QUANON/items/2539feed89cee2290664 couple = '👨👩' p couple.length #=> 3 # \X Unicode 結合文字シーケンス (eXtended grapheme cluster) (?>\P{M}\p{M}*) p couple.scan(/\X/).length #=> 1 # \u{0308} はウムラウト p euml = "e\u{0308}" # "ë"。"〜"で囲む p /\X/.match(euml) #=> #<MatchData "ë"> ウムラウト有り p $&.codepoints #=> [101, 776] # \w 単語構成文字 [a-zA-Z0-9_] # \W 非単語構成文字 [^a-zA-Z0-9_] p /\w/.match(euml) #=> #<MatchData "e"> ウムラウト無し p $&.codepoints #=> [101] p couple.chars #=> ["👨", "", "👩"] p couple.grapheme_clusters #=> ["👨👩"] 書記素クラスタ # U+200D は、Zero Width Joiner (ZWJ: ゼロ幅接合子) couple.each_char { |chr| puts(format('U+%04X', chr.ord)) } # U+1F468, U+200D, U+1F469 (euml + couple).each_grapheme_cluster { |chr| puts(format('U+%04X', chr.ord)) } # U+0065, U+1F468 # つまり先頭文字である、'e👨' だけになる http://mevius.5ch.net/test/read.cgi/tech/1677826018/826
844: デフォルトの名無しさん [sage] 2024/06/18(火) 03:01:03.27 ID:4d4deoVm 「漢字Aと漢字Bは〇〇の関係にある」 この〇〇には異体や異字体は入るが、異体字や異体文字は入らない。異体字は字体の関係性ではなく個々の文字を指す用語。 「異なる字体」と言いたい場合は「異体/異字体」を使用する。 「字体」とは文字の骨格となる構成を言う。「字形」や「書体」とは違う概念 http://mevius.5ch.net/test/read.cgi/tech/1677826018/844
901: デフォルトの名無しさん [sage] 2024/07/17(水) 13:11:18.27 ID:7vbDx03j そりゃその話の流れだとbomありutf8でしょ ま広まらないと思うけど悪くはない utf8にbomは不要という原理主義は頭固い http://mevius.5ch.net/test/read.cgi/tech/1677826018/901
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.035s