[過去ログ]
文字コード総合スレ Part12 (1002レス)
文字コード総合スレ Part12 http://mevius.5ch.net/test/read.cgi/tech/1544931495/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
848: デフォルトの名無しさん [sage] 2020/02/05(水) 10:24:42.24 ID:MS9bo9CR 固定フォントじゃなくて等幅フォントでした http://mevius.5ch.net/test/read.cgi/tech/1544931495/848
849: デフォルトの名無しさん [] 2020/02/05(水) 16:23:36.59 ID:2rKdW1Ec てすと ☸ http://mevius.5ch.net/test/read.cgi/tech/1544931495/849
850: デフォルトの名無しさん [] 2020/02/05(水) 16:24:56.28 ID:2rKdW1Ec >>844 うちのChromeはちゃんと出てる ffでも問題なし http://mevius.5ch.net/test/read.cgi/tech/1544931495/850
851: デフォルトの名無しさん [] 2020/02/05(水) 16:28:36.97 ID:2rKdW1Ec >>847 前にpythonで書いたときは unicodedata.east_asian_width() 使ったと思う Win32APIだと表示前に文字列全体の描画幅を求める方法があったと思う http://mevius.5ch.net/test/read.cgi/tech/1544931495/851
852: デフォルトの名無しさん [sage] 2020/02/05(水) 16:30:38.68 ID:So1jciyU ☸ 法輪ラブ ☸ http://mevius.5ch.net/test/read.cgi/tech/1544931495/852
853: デフォルトの名無しさん [sage] 2020/02/05(水) 18:34:07.02 ID:qBm/0cTb >>847 ・Unicodeでは文字幅は 0(結合文字)、1(いわゆる半角)、2(いわゆる全角)、1か2(曖昧幅) のいずれかに決まっている ・1か2になるのはαや☆などであり、東アジアの環境で2、それ以外で1 ・wcwidthで調べるとその値を返すが、曖昧幅への対応がどうなっているかは分からない ・linuxのglibcは、データを自分で修正しない限り曖昧幅は1扱い(LANG=ja_JP.eucJPすれば2にはなる) ・CLIでのカーソル位置はカーネルのttyドライバが担当しており、そもそもフォン卜の情報を持っていない ・linuxカーネルでは全ての文字が(全角も)幅1扱い ・行編集もtty担当なので、catをそのまま実行して全角文字を入力後backspaceするとカーソルがずれる ・多くのシェルはwcwidthで入力/削除された文字やプロンプトに表示する文字の幅を調べ、必要に応じてカーソルを移動させる ・ターミナルはwcwidthまたは同等の独自関数(曖昧幅の設定ができることが多い)で文字幅を調べて、実際に表示させる ・等幅フォントでも曖昧幅の文字がどちらで実装されているかそれぞれ異なる上、ターミナルはフォントの文字幅情報を使わないことが多い(プロポーショナルでないことのみ確認) ・↑により、文字が重なったり変な隙間ができたりすることがある ・一部のターミナルはwcwidthの結果に従うように文字を潰したり引きのばしたりして表示する(minttyとか) ・アプリ(シェルとか)、ライブラリ(ncursesとか)、端末マルチプレクサ(tmuxとか)、端末エミュレータ、カーネル(tty)、フォント全てで想定する幅がそろっていないとうまく動かない ・日本語フォントの多くは曖昧幅2なので、linuxのCLIではαや☆がおかしくなることが多い(wcwidthが1を返すせい) ・Unicodeを作った西洋人は馬鹿だから、罫線素片の幅も曖昧で、ncursesがバグる ・絵文字は文字幅1だが、フォン卜の多くは2で実装されているのでおかしくなる http://mevius.5ch.net/test/read.cgi/tech/1544931495/853
854: デフォルトの名無しさん [sage] 2020/02/05(水) 20:43:09.91 ID:f5dE3Mu+ >>853 詳しい解説サンクス http://mevius.5ch.net/test/read.cgi/tech/1544931495/854
855: デフォルトの名無しさん [sage] 2020/02/05(水) 23:12:39.17 ID:zWcxLf4u >>853 あざす やっぱり混沌としてるのですね とりあえず一度ターミナルの中を追ってみようかな http://mevius.5ch.net/test/read.cgi/tech/1544931495/855
856: デフォルトの名無しさん [sage] 2020/02/06(木) 00:00:39.94 ID:SQAVqXtr >>844うちでも見れた http://mevius.5ch.net/test/read.cgi/tech/1544931495/856
857: デフォルトの名無しさん [sage] 2020/02/07(金) 22:23:32.71 ID:DCA95dh2 継ぎ接ぎだらけの一貫してない仕様だからな http://mevius.5ch.net/test/read.cgi/tech/1544931495/857
858: デフォルトの名無しさん [sage] 2020/02/08(土) 17:47:47.28 ID:hv0txQ7A Unicodeの時代に今更だけど、 シフトJISの第2バイトがA0〜FFでなく 40〜FCにしたのは何でだろう http://mevius.5ch.net/test/read.cgi/tech/1544931495/858
859: デフォルトの名無しさん [sage] 2020/02/08(土) 17:48:29.82 ID:hv0txQ7A 訂正 ×A0〜FF 〇80〜FF http://mevius.5ch.net/test/read.cgi/tech/1544931495/859
860: デフォルトの名無しさん [sage] 2020/02/08(土) 18:36:07.73 ID:zjMP9HD4 JISの区点は1区あたり94点 0x40開始で0x7Fを避けて2区分取ると0xFCになる http://mevius.5ch.net/test/read.cgi/tech/1544931495/860
861: デフォルトの名無しさん [sage] 2020/02/09(日) 12:59:57.61 ID:tCetl5aZ やっぱ漢字1文字は2バイトの方がいい http://mevius.5ch.net/test/read.cgi/tech/1544931495/861
862: デフォルトの名無しさん [sage] 2020/02/09(日) 15:51:09.68 ID:gml78nRc >>858 半角カナのせいで80〜FFでは足りないから http://mevius.5ch.net/test/read.cgi/tech/1544931495/862
863: デフォルトの名無しさん [sage] 2020/02/09(日) 19:30:21.11 ID:tCetl5aZ シフトJISはもう少し工夫すれば JISコードの変換式もより簡単にでき 2バイト目もASCII領域を使わずにダメ文字も発生せず 補助漢字も全て入れられた http://mevius.5ch.net/test/read.cgi/tech/1544931495/863
864: デフォルトの名無しさん [sage] 2020/02/09(日) 19:32:13.43 ID:tCetl5aZ 補助漢字は半角カナと排他だけど http://mevius.5ch.net/test/read.cgi/tech/1544931495/864
865: デフォルトの名無しさん [] 2020/02/10(月) 16:27:01.61 ID:TGcYvj29 EUCで良かったんよ http://mevius.5ch.net/test/read.cgi/tech/1544931495/865
866: デフォルトの名無しさん [sage] 2020/02/10(月) 19:14:50.21 ID:hRmPfOYI EUCだと半角カナも補助漢字もバイト数が増えるからな... http://mevius.5ch.net/test/read.cgi/tech/1544931495/866
867: ◆QZaw55cn4c [sage] 2020/02/10(月) 21:20:39.00 ID:3bnN/FFY >>863 あのスペースの狭さでは、それは無理だったのでは? どうするのがよかったのですか?具体的にいってみてよ http://mevius.5ch.net/test/read.cgi/tech/1544931495/867
868: デフォルトの名無しさん [sage] 2020/02/11(火) 08:36:25.76 ID:K5Jxm44G 非漢字_:[81-98] [80-9F] 第1水準:[80-9F] [A1-FE] 第2水準:[E0-FF] [A1-FE],[E0-EB] [80-9F] 補助漢字:[A0-DD] [A1-FE],[A4-C1] [80-9F] 補助漢字は半角カナと排他利用 http://mevius.5ch.net/test/read.cgi/tech/1544931495/868
869: ◆QZaw55cn4c [sage] 2020/02/11(火) 17:40:51.63 ID:Sh/x76Zj >>868 それは結局半角カナを潰しただけのことでは? http://mevius.5ch.net/test/read.cgi/tech/1544931495/869
870: デフォルトの名無しさん [sage] 2020/02/11(火) 18:51:44.66 ID:K5Jxm44G >>869 補助漢字6000字近くを使えるというメリットがあれば 半角カナをフェードアウトするには十分な機会になっただろう 補助漢字(JIS X 0212)が制定されたのは1990年だから その翌年の1991年に発売されたMS-DOS 5.0あたりで KANA ON/OFFコマンドを追加し、半角カナ/補助漢字の切り替えが出来れば 従来のテキストファイルの読み込みなども対応できる http://mevius.5ch.net/test/read.cgi/tech/1544931495/870
871: ◆QZaw55cn4c [sage] 2020/02/11(火) 19:27:04.32 ID:Sh/x76Zj >>870 文字コードのマップ切り替えはコンテンツ側で指示するべきことであって、OS/アプリ側で切り替えて対応するとか、発想が変だとおもいますね http://mevius.5ch.net/test/read.cgi/tech/1544931495/871
872: デフォルトの名無しさん [sage] 2020/02/12(水) 01:19:59.31 ID:l8Pmdafn いっその事1byte=32bitにすればサロゲートペアもBOMも要らなくなるし多バイト文字という概念もなくなる http://mevius.5ch.net/test/read.cgi/tech/1544931495/872
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 130 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.009s