[過去ログ] 文字コード総合スレ Part11 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
814: 2018/09/21(金)16:14 ID:dtC8HZuo(2/2)調 AAS
>>813
なるほど。復元は無理ってことですね。thx
815
(1): 2018/09/21(金)22:27 ID:VETs/R35(1)調 AAS
URLエンコードとか16進文字列で表示してほしいよね。
文字化け文字列を表示されても途方に暮れる。
816
(1): 2018/09/22(土)12:49 ID:xOVRbYWf(1)調 AAS
>>815
表示したい文字とそれ以外をどうやって区別させる?
817: 2018/09/22(土)13:55 ID:PGp2AKzL(1)調 AAS
低学歴知恵遅れの世界ではグリフが違うように見えれば
その字じたいがもつ意味もかわる
818: 2018/09/22(土)16:15 ID:lyt/iYyi(1)調 AAS
φと Φ の小さい字が小文字 ɸ だと一緒のはずなんだが環境によって違うのが困る unicode のくせに
819: 2018/09/23(日)04:36 ID:D4/zD5nR(1)調 AAS
https://github.com/JuliaStrings/utf8proc
これすばらしいね。
UTF8の煩雑な処理がC89という極めて汎用で互換性の高い言語で扱えるなんて。

ただUnicode11対応を謳ってる割には曖昧文字幅が考慮されてないのが難点
issueやPRを見てるとそれっぽい対応がされてるのかどうなのか……。
https://github.com/JuliaStrings/utf8proc/pull/83

Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b)
820: 2018/09/23(日)13:00 ID:7oyGtio1(1)調 AAS
>>816
書き手と読み手で共通のルールを作ればいいだけのこと。
どのみちASCII文字しか使えないので禁則文字が必要。
821: 2018/09/25(火)01:23 ID:lmrEE7TE(1/4)調 AAS
https://www.softek.co.jp/SPG/Pgi/performance52.html
ここのページのエンコーディングって分かる?
EUC-JPで読みこむと漢字だらけ
Shift JISで読みこむと半角カナの「ス」だらけ
UTF-8で読みこむと非文字だらけ
822: 2018/09/25(火)11:23 ID:Ldj267OX(1)調 AAS
chrome で開いたけど問題なく日本語出るぞ
おまいのブラウザが糞なんじゃね

ブラウザ経由せずに python でダウソしたら中身 UTF-8 のファイルが出来た
<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">
EUC-JP ってことになってるな
823: 2018/09/25(火)12:50 ID:lmrEE7TE(2/4)調 AAS
やっぱFirefoxはゴミですね
824: 2018/09/25(火)13:50 ID:O6wzDQwM(1/2)調 AAS
そのサイトうちのffタソは普通に日本語出してる
825
(1): 2018/09/25(火)15:39 ID:po7dXpcK(1/2)調 AAS
夜に見たときはFirefoxでもChromiumでもWaterfoxでも
ID:lmrEE7TEが言うような文字化けになってたけど
今はFirefoxでもChromiumでもWaterfoxでも文字化けせずに見られる
そのサイトのほうがおかしくなってたんじゃないか?
826: 2018/09/25(火)15:45 ID:O6wzDQwM(2/2)調 AAS
apacheとかデフォでutf-8に強制変更とかあるからな
827: 2018/09/25(火)16:40 ID:hDTNQGQ/(1)調 AAS
>>825
同じく
夕べ、バイナリモードでgetしたhtmlが思いきり文字化けしてたわ
828: 2018/09/25(火)16:45 ID:EqDfiqim(1/4)調 AAS
奇遇ですね
私もちょうど昨日そのサイト見てました
829
(2): 2018/09/25(火)17:23 ID:lmrEE7TE(3/4)調 AAS
あっっれ。
まさかなと思ってもう一度行ったら なんかちゃんと読めるようになってたわ。
うーん。向こうの不具合かな。とりあえずFirefoxに濡れ衣を着せてしまったことをお詫びします。

ただしFirefoxには
http://www.am.ics.keio.ac.jp/~keisuke/lab/ptex218.html
↑このページが読めないという前科があるんだよね。
830: 2018/09/25(火)17:33 ID:EqDfiqim(2/4)調 AAS
最近のブラウザは一時的に文字コード指定するメニュー無くなった
831: 2018/09/25(火)17:41 ID:UWcApuPo(1)調 AAS
>>829
そのページはサーバーでUTF-8決め打ちで送って来てる
ファイル内に書かれたcharsetとどっちを優先するかって話なのかな
832
(1): 2018/09/25(火)18:07 ID:po7dXpcK(2/2)調 AAS
http://www.am.ics.keio.ac.jp/~keisuke/lab/ptex218.html
WaterfoxやChromiumでも文字化けする
Waterfoxだと文字コードの手動切り替えで対応できるけど
自動判定できない状況に陥っているのだからサイト側の問題なんだろうね
833: 2018/09/25(火)18:35 ID:EqDfiqim(3/4)調 AAS
HTTPはheaderみてそっち優先のブラウザばっかになってつまらんぬ
834
(1): 2018/09/25(火)18:40 ID:YBMAwOu6(1)調 AAS
そういえば、昔おまじない文字ってあったよな
「京」とか
835: 2018/09/25(火)19:00 ID:lmrEE7TE(4/4)調 AAS
だいたい日本語TeXを使ってるのなら文字コードに関する知識はそれなりにある筈なんだけどなぁ
836: 2018/09/25(火)19:01 ID:EqDfiqim(4/4)調 AAS
>>834
美乳
837: 2018/09/25(火)23:09 ID:dH/9GcKQ(1)調 AAS
>>829
EdgeでもIE11でも読めないぞ。
これもFirefoxのせいじゃない。
ちなみにw3mでは読めた。

>>832
サーバーがレスポンスヘッダで文字コードをUTF-8と返してるからそれに従ってるだけ。
そもそも自動判定しようとしてない。それなのにコンテンツはUTF-8以外(ISO-2022-JP)で出来てる。
要はサーバーの設定とコンテンツの不整合。
恐らくサーバー更新時に古いコンテンツのことを考慮してなかったんだろうな。
838: 2018/10/01(月)00:48 ID:MJnLVykJ(1)調 AAS
これってよくあるよな
839: 2018/10/01(月)06:54 ID:lrLCBstk(1)調 AAS
なにが?
840: 2018/10/01(月)09:18 ID:CSe7Ol42(1)調 AAS
サーバーが余計なこといってるやつ
841: 2018/10/02(火)15:20 ID:YIYqcJyy(1)調 AAS
RedHat や CentOS のパッケージで Apache をインストールするとデフォルトで AddDefaultCharset UTF-8 が有効になっているのが原因。
この設定をコメントアウトし忘れると今回のようなことが起きてしまう。

これ、わりと迷惑度合いの高いデフォルト設定なんだよねえ……
842: 2018/10/02(火)15:47 ID:yDKwoLm6(1)調 AAS
何を今更
843: 2018/10/03(水)08:04 ID:ej0n10jM(1)調 AAS
UTF-8デフォルトはそれこそLinux機にとっては嬉しいんだけどねぇ
ちなみにnghttp2というHTTP/2に特化したWebサーバーは
HTTP/2の既定エンコーディングがUTF-8であるにもかかわらずなんとASCII。
いつの時代だよ……。しかも古いプロジェクトじゃなくてめっちゃ新しいのに……。
844: 2018/10/09(火)21:29 ID:cJ7fFqob(1)調 AAS
最近またUnicodeが分からなくなってしまった。
単にShift_JISのような
「一部コードを拡張マップ専用の文字にして後続のコードを
その拡張マップ専用の文字のコードと連続した(つまり2次元的な配置の)コードとして
処理する」
っていう方法ではないのか。
845: 2018/10/10(水)01:30 ID:cxHjn/W/(1)調 AAS
違う
846: 2018/10/10(水)02:38 ID:cuDZW5pF(1)調 AAS
サロゲートペアの話?
847: 2018/10/10(水)16:28 ID:WmZeX0g1(1)調 AAS
ISOのダウンロードサイトがもう何年も
本文はちゃんとcharset=ISO-8859-1だと書いてるのに
HTTPヘッダでcharset=UTF-8宣言してて台無しになってる。
ASCIIはいいけどフランス語のとこがずっと文字化けしてるんだけど誰も気付かないのかね。

……と書き込もうと思って確認したらいつの間にか直ってたわ、ちっ
848: 2018/10/15(月)00:47 ID:FbFcpKzK(1)調 AAS
実際に使用されていた、おもしろい文字コードとかない?
例えばBaudot Codeは英数字がバラバラの順番で出現する、非直感的な配置になってる。
849
(1): 2018/10/15(月)04:39 ID:/DZZgAIK(1/2)調 AAS
EBSDICのことか
850: 2018/10/15(月)04:40 ID:/DZZgAIK(2/2)調 AAS
EBCDICだったすまそ
851: 2018/10/16(火)14:17 ID:lPgoIDQ1(1)調 AAS
Apple、「ベーグル」の絵文字にクリームチーズを追加──要望を受け
http://www.itmedia.co.jp/news/articles/1810/16/news086.html
852: 2018/10/16(火)21:00 ID:+1MBTbsX(1)調 AAS
IEC646を使う事ももやめてUS-ASCIIに統一した方がいいよな。
それで問題が起きる時はフォントの方を変えて対処すればいい
853: 2018/10/16(火)22:29 ID:xkS5MTi4(1)調 AAS
絵文字はどんどん規格にない不文律が増えていくんだな
854
(1): ◆QZaw55cn4c 2018/10/16(火)22:46 ID:YZqafHqA(1)調 AAS
誰がunicodeに絵文字顔文字なんかいれたんだ?
855: 2018/10/18(木)09:37 ID:9Pcdnt1S(1)調 AAS
>>854
Google Japan Blog: 絵文字のユニコード符号化: 符号化提案用のオープンソースデータ
https://japan.googleblog.com/2008/11/blog-post_27.html
856: 2018/10/21(日)02:11 ID:fBvnF/D1(1)調 AAS
つまり結局のところどうしたらええんじゃ?
857: 2018/10/21(日)11:20 ID:sjXodBVw(1)調 AAS

858: 2018/10/21(日)21:31 ID:8BH3p2hm(1)調 AAS
https://en.wikipedia.org/wiki/Template:Smiley
ここの絵文字のソースコードを見ると<abbr>要素を使ってマークアップしてるんだけど
こういうのって一般的なのかな。
859: 2018/10/21(日)23:19 ID:j+lXdzx1(1)調 AAS
Wikipediaはある種独特じゃね
860
(1): 2018/10/29(月)01:00 ID:OPK1oA4w(1)調 AAS
https://s.codepen.io/aardrian/debug/ENJdjN
ここでは
<span role="img" aria-label="Snowman">☃</span>
としてるね
861: 2018/10/29(月)11:18 ID:rTl7m6mf(1)調 AAS

862
(1): 2018/10/29(月)12:04 ID:oLCvh0eX(1/2)調 AAS
マルチバイト文字を2つのシングルバイト文字で囲いたい場合
マルチバイト文字の中にそのシングルバイト文字があった場合、囲えないんですけど
マルチバイト文字を理解しないで囲うにはどうしたらいいですか?
863: 2018/10/29(月)12:49 ID:VtmwN/uo(1)調 AAS
utf8
864: 2018/10/29(月)15:46 ID:AJZhbohO(1)調 AAS
>>862
仮にUTF-32で処理したところで、今は合成やらIVSやらZWJやら絵文字やらで
特殊ルール満載で境界が曖昧なので、理解しないで1文字切り出すのは無理
865: 2018/10/29(月)16:16 ID:oLCvh0eX(2/2)調 AAS
ありがとうございます
自己解決しました。
866: 2018/10/30(火)22:48 ID:sNif6dsM(1)調 AAS
Draft Emoji Candidates
http://www.unicode.org/emoji/future/emoji-candidates.html

何個目だよハート
そして色つきの丸と四角がいっぱい
867: 2018/10/31(水)00:23 ID:W1Oq41Ld(1)調 AAS
オイスターは動物じゃなくて食いもん枠なのか
868: 2018/10/31(水)23:32 ID:VU8NOm8y(1)調 AAS
U+2053のSWUNG DASHってどういうときに使うか分かる?
波ダッシュと同じ使い方でいいのかな。
869: 2018/11/01(木)00:15 ID:+UpfaFuk(1)調 AAS
ホゲエ〜だと力が足りない時に使う
870
(1): 2018/11/01(木)10:43 ID:z733lC2q(1)調 AAS




~
~








~

~


871
(1): 2018/11/01(木)12:02 ID:rRwKTtG6(1)調 AAS
>>870
床に落ちてる縮れ毛みたいだね
872: 2018/11/01(木)12:10 ID:VLboL17t(1)調 AAS
gal undo
873: 2018/11/01(木)13:23 ID:EuhtjlAA(1)調 AAS
>>871
こんなきれいに並べんやろ
874: 2018/11/04(日)22:18 ID:V6s3/sLe(1)調 AAS
>>860
alia-label=属性は絵文字の音声読み上げが上手くできなかった時代の対処療法。
今はほとんどの(特に視覚障碍者が使うような)音声読み上げが絵文字に対応してるので
必要ないかと。role=属性をimgにするという案はいいね。
875: 2018/11/05(月)15:43 ID:TZRFRfjm(1)調 AAS
今でもASCII制御文字で使われている物はHT CR LFくらいかな?
876: 2018/11/05(月)17:16 ID:o5QGnfIr(1)調 AAS
C/C++なら今でも\aで音出るよ
877: 2018/11/05(月)20:56 ID:4CVibwX5(1)調 AAS
今のPCもマザボにスピーカー入ってるの?
878: 2018/11/06(火)02:07 ID:dakOghSY(1)調 AAS
NUL SO SI ESC SPACE DEL 辺りも使うかな
879: 2018/11/06(火)11:04 ID:FAqyZmup(1)調 AAS
RLOも現役ぽいなあ
880: 2018/11/06(火)11:35 ID:vyXuaWzf(1)調 AAS
^C
881: 2018/11/06(火)11:46 ID:rqFrnjhJ(1)調 AAS
BSも利く
882: 2018/11/06(火)13:19 ID:e09+EfP6(1)調 AAS
^cはシグナルを送るキーとして使われてるだけで改ページの意味があるわけではないからなあ
とはいえ改ページとしてのFFがあるテキストファイルもたまにある
883: 2018/11/06(火)13:28 ID:qdniag2/(1)調 AAS
Win32APIのMessageBoxはテキストに0x03が含まれてるとゴニョゴニョ
884: 2018/11/09(金)01:31 ID:c1qAdcQz(1)調 AAS

885: 2018/11/09(金)19:51 ID:3ZHBVzZ5(1)調 AAS
Unicodeの概念そのものは好きだけど
太字の「>」とか 要る? そういう太字にしたり斜体にしたりするのはワードプロセッサーや写植システムの役割だろう。
886: 2018/11/09(金)21:06 ID:romiKFBS(1)調 AAS
知らんけどもともとどっかにあったんじゃないの?
とりあえずなんでも拾っとくことこそUnicodeの概念とやらの本質じゃないの?
887
(1): 2018/11/10(土)02:40 ID:1I6WGnS3(1)調 AAS
なんでも拾っておくってなら、CJKまとめるなんて暴挙はなかったろ
888: 2018/11/10(土)12:59 ID:RdMcj9Zd(1)調 AAS
別々の集合からならまとめても元に戻せるから矛盾しないぞ
889: ◆QZaw55cn4c 2018/11/10(土)13:35 ID:gF+s2COR(1)調 AAS
>>887
それは16ビットで収めるためのMSの暴挙
890: 2018/11/10(土)13:36 ID:6fDrSpR2(1)調 AAS
太字よりも、色付き絵文字に呆れた。
891: 2018/11/10(土)15:49 ID:gwVpzklH(1/2)調 AAS
絵文字排除するはずだったのに何のための文字コードだったのか
892: 2018/11/10(土)15:52 ID:mjExs0JA(1)調 AAS
むしろいちいちフォントなんか使わずに画像使えばいい
893: 2018/11/10(土)16:19 ID:gwVpzklH(2/2)調 AAS
害児のための外字
894: 2018/11/12(月)16:28 ID:sDbkVTfY(1)調 AAS
記号類にもUnihan Databaseみたいな典拠集積したやつを作っておくべきだったなとは思う。
895: 2018/11/13(火)03:51 ID:T2RztKBH(1)調 AAS
テスト
🐱‍👤🐱‍🏍🐱‍💻🐱‍🐉🐱‍👓🐱‍🚀
896: 2018/11/14(水)00:25 ID:7Ifnwzhb(1)調 AAS
test󾬄󾌰󾍇󾌵󾔣󾔥󾹄
897: 2018/11/14(水)15:22 ID:DziNZxCd(1)調 AAS
test123
898: 2018/11/23(金)10:18 ID:e4GZHgy/(1)調 AAS
https://pbs.twimg.com/media/DsbSo7oU4AAKJ-e.jpg

899
(1): 2018/11/23(金)22:12 ID:8npogZAr(1)調 AAS
「画数の多い文字」として知られているけれども本当に実用されていた文字なのか誰も確認できず、
しかし「画数の多い文字の例」として使われているために少なくともそれ以後は実在していると考えるしかないという
900: 2018/11/23(金)23:52 ID:LJvBE/cy(1)調 AAS
>>899
じゃあ実用されていた漢字で一番画数が多いのはなんですか?
901: 2018/11/24(土)00:12 ID:GcFLRWmR(1)調 AAS
実用なら身も蓋もありませんが親鸞の「鸞」と、2chでもおなじみの「鬱」でしょうね

新聞で使う文字に限るなら「鑑」で、
本当の意味での常用漢字なら「襲う」と「驚く」でしょうね
本当に身近な字ですが無駄に画数多いよね!
子供の日記でも「〜でおどろいた」と良く使われるフレーズなのにね!
902: 2018/11/24(土)00:16 ID:jHhCYnAM(1)調 AAS
ためになるなあ
903
(2): 2018/11/24(土)09:56 ID:b7FMpfFJ(1)調 AAS
https://map.goo.ne.jp/place/22001814283/
浜松市に「たいと(雲雲雲龍龍龍)」という四川料理店があるが、
これで「実用化」されたことになるだろう。
904
(1): 2018/11/24(土)13:17 ID:4kdGLnPd(1/3)調 AAS
學校
臺灣
國體
驛辯
やめたくなるわな
905
(1): 2018/11/24(土)13:24 ID:4kdGLnPd(2/3)調 AAS
>>903
看板と幟で確認出来るようだ
肝心な部分が隠れてるけど
https://dotup.org/uploda/dotup.org1699600.jpg

他のアングルだと欝ってなかった
906: 2018/11/24(土)13:49 ID:rXljiVhx(1)調 AAS
複雑な文様・難解な表記ほど有難いと思ってるやつがいるうちは漢字は世にはばかり続けるだろう
907: 2018/11/24(土)14:28 ID:4kdGLnPd(3/3)調 AAS
明後日の方向からレスが来た
908: ◆QZaw55cn4c 2018/11/24(土)14:33 ID:nrZVZwkF(1)調 AAS
>>904
>驛辯
辨・辧・瓣・辮・? かもしれませんよ…それらが合わさって弁になったんです
909
(1): 2018/11/24(土)22:16 ID:nC23MCFq(1/2)調 AAS
メールも8bit文字ををBase64などでエンコードせずにそのまま送れるのが標準になってほしいよ
普段使っているメールサーバーにtelnetを使ってEHLOではなく従来のHELOでログインして
ヘッダーにshift jisをエンコードせずに入れたメールを送ってみたが問題なく送れたから
SMTPUTF8対応を明言していなくても8bitを送れるメールサーバーは結構あるんだろうけど
910: 2018/11/24(土)22:31 ID:3CbvFbkZ(1)調 AAS
20年くらい前にfjで「8bit通らないMTAってまだどっかで稼働してるのかね?」って話をしてたような気がするが。
911: 2018/11/24(土)23:28 ID:or35NFsF(1)調 AAS
ならUTF-7使うしかない
912: 2018/11/24(土)23:36 ID:nC23MCFq(2/2)調 AAS
20年前でもほぼ8bitが通る状況だったならMUAの側も
8bit文字をエンコードせずに送る設定を用意してもよさそうだが
それができるMUAはあるんだろうか
913: 2018/11/25(日)00:05 ID:KC5pxzP6(1)調 AAS
>>903
店名って公的な機関に届け出る書類に記載したりすることあるのかな?
この漢字は使えたのだろうか...
1-
あと 89 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.030s