Navi2ch for Emacs (Part 22) (390レス)
1-

278: 2024/02/24(土)21:28 AAS
quelpa見るとmakeinfoでinfo作ってるようだから、makeinfoというファイル名で
コード変換して本物makeinfoに渡すスクリプト噛ませれば解決しない?
コード変換すると全部入れ替えだから二の足踏んでるんだよね。
279: 2024/03/25(月)21:03 AAS
原因は特定できないけれど Windows 11以降、謎の文字化けが起きるようになった
例えば、米こうじの「こうじ」、ウソつきの「うそ」、全角チルダ(~)等

どれもWindows 10までは普通に入力できていた文字
「うそ」は、機種依存文字でないほうも書き込めない
「以前のバージョン」のIMEも試してみた
自分以外にも似た文字化けを見たのでOS固有の問題かもしれないけれど
ウェブブラウザでは正常に書き込まれる
280
(2): 2024/03/26(火)20:03 AAS
macで書き込みテスト
うそ(印刷標準字体)、うそ(略字)、こめこうじ、全角チルダ
噓、嘘、米麹、〜
281: 2024/03/27(水)19:59 AAS
今回は乗客の通販とか凄いねしか書けないんだろう
国葬すべきだよな
絶対に潰します!」(ずっと待ってるんだから当然
バグはシステムをそのまま持ってきた意味を分かってたはず
282: 2024/03/27(水)20:49 AAS
定期的に
283: 2024/03/28(木)20:37 AAS
「麹」(こうじ)は入力できた
JISで使用可能な異体字が最初から候補に入ってなかった
外部リンク:dictionary.goo.ne.jp
「剥」(ハク,むく)
外部リンク:dictionary.goo.ne.jp
も同じ
JIS/S-JISで扱えない文字は抑制するとかできないかな

全角チルダやウソは無理
異体字関連のように見えるけれど、S-JISの5C問題ではないんよね
外部リンク:zenn.dev
284: 2024/04/02(火)15:44 AAS
>>280
> うそ(印刷標準字体)、うそ(略字)、こめこうじ、全角チルダ
> 噓、嘘、米麹、~

chmateから
噓、嘘、米麴、米麹、~、~(波ダッシュ)
285: 2024/04/02(火)16:00 AAS
>>280
波ダッシュになってるなあ
波ダッシュをJIS X 0208にない全角チルダに変換してしまうのは
Windowsが長らく抱えていた問題だけど
11で変えたんだな
Emacsが依存してるのかね
それともproxy?
286: 2024/04/17(水)02:13 AAS
わかったああああぁ!
外部リンク:qiita.com

自分が全角チルダと思っていたのは波ダッシュで
Unicodeの波ダッシュが今まで”下がって上がる”形に誤記されていたのか
画像リンク[png]:upload.wikimedia.org

S-JISに存在しないキャラクタコードを入力したらそりゃおかしくなるわけだわ
とりあえず「にょろ」で「〜」を登録しておいた
ウソや「しょうゆ」も何かこういうコーディング問題だろうな
最新ベータのNavi2chを使えば混合表記でも消えたりしないのかもね
うちはコンパイルしてもしなくても途中でエラーが出て使えないから
287: 2024/05/25(土)10:14 AAS
IMEへ登録しても異体字に環境依存文字(非JIS/S-JIS)が含まれると文字化けするな
他は変えていないからWindows11固有のバグなのか

(coding-system-put 'cp932 :encode-translation-table
(get 'japanese-ucs-jis-to-cp932-map 'translation-table))

これを ~/init.el に設定しておくと〜(波ダッシュ)だけは文字化けしない模様
288: 2024/06/08(土)17:33 AAS
文字化け問題が解決したので報告

最近リリースされたEmacs 29.3へ更新したら異体字が書き込めるようになった
Windows 11のリリースに合わせて修正されたのかもしれない
そのままだとUnicode文字は入力できないけれどS-JISの文字まで消えることはない
289
(1): 2024/06/09(日)14:16 AAS
やっぱりダメだわ
何か条件があって書き込めるときと文字化けするときがある
Emacs更新で文字化けしにくくはなったけれど理由が不明
290
(2): 2024/06/28(金)11:59 AAS
文字化け問題

(make-coding-system
'japanese-iso-8bit 2 ?E
"ISO 2022 based EUC encoding for Japanese (MIME:EUC-JP)"
'(ascii japanese-jisx0208 katakana-jisx0201 japanese-jisx0212
short ascii-eol ascii-cntl nil nil single-shift)
'((safe-charsets ascii latin-jisx0201 japanese-jisx0208 japanese-jisx0208-1978
katakana-jisx0201 japanese-jisx0212)
(mime-charset . euc-jp)))

(define-coding-system-alias 'euc-japan-1990 'japanese-iso-8bit)
省4
291
(1): 2024/06/28(金)12:00 AAS
(改行エラーで弾かれた続き)

さらに言語リストに追加

(set-language-info-alist
"Japanese" '((setup-function . setup-japanese-environment-internal)
(exit-function . exit-japanese-environment)
(tutorial . "TUTORIAL.ja")
(charset japanese-jisx0208 japanese-jisx0208-1978
japanese-jisx0212 latin-jisx0201 katakana-jisx0201
japanese-jisx0213-1 japanese-jisx0213-2)
(coding-system iso-2022-jp japanese-iso-8bit
省9
292
(1): 2024/07/31(水)22:10 AAS
備忘録も兼ねて一応報告
汎用ウェブブラウザのUser Agentが全て死亡

Chrome, Firefox, Edge等のUAでアクセスすると、例えばニュース速報+の場合
2ch板:newsplus外部リンク:itest.5ch.net
へ飛ばされる
飛ばされるだけなら読み込めるけれど、JavaScriptを要求してくる
実はかなり前からウェブブラウザでは要JSで、CGIは裏でサポートする体制だった
本日午前までは CGI 方式で読み込めたのを確認しているけれど今は無理
新型専ブラには知っての通りログインシステムに脆弱性がありCGI形式も残っている

プロファイルやプロキシでAPI対応ブラウザのUAを指定すれば旧専ブラもまだ使える
293
(2): 2024/08/02(金)21:27 AAS
>>292
navi2emacs使ってないからわからないけどcookieで5chClassicをonにセットじゃだめかな?
294: 2024/08/03(土)20:39 AAS
>>293
cookieを直接操作するコマンドがないのよね
proxyの「パラメータの置換を許可する」コマンド等で代用できればいいんだけど
295: 2024/08/04(日)06:27 AAS
>>293
でも情報をありがとう
他の専ブラで殆ど騒ぎになってないから不思議に思ってた
なにか手を考えてみる
296
(2): 2024/08/04(日)11:34 AAS
>>266

windows だとdefaultで C:\Program Files\Emacs\emacs-??.? みたいに2階層下にインストールされるから

> $ meson setup builddir

で emacsがない! となるんだな
(しかしよく作りこんでるなぁ,とパッチ作者には感謝しかない
297: 2024/08/06(火)19:53 AAS
(navi2ch-net-store-cookie '("5chClassic" "on") ".5ch.net" "/")

とかやれば設定はできそうな気がする。
298: 2024/08/15(木)15:43 AAS
?v=pc
299: 2024/08/27(火)00:42 AAS
>>290
文字化け問題。よく理解していないけど、文字化けするサンプルをUTF-8でセーブして、base64してクレないか?

>>296
emacs-2[7-9].[1-4]を検索するようにしてみてcurrentブランチにpushした。 >>266の手順でどーぞ。
300: 警備員[Lv.4][新芽] 2024/08/27(火)08:39 AAS
>>289
振る舞いが違うことがあるのは
文章に使われてる文字集合セットが違うからだと思う
>>290のsafe-charsetsにバッファーの全ての文字が含まれてるか確認して
利用可能なcoding-systemのリストを作り
>>291のcoding-priorityに合せて
どのcoding-systemを使うかemacsは選ぶ

5chの利用可能なcoding-systemがどうなっているか知らないけど
(どの板でも常にutf8を使えればいいのだけど)
現在レガシーでしかないIso2022jp,eucjp,sjis,cp932等を使わない方がいい
省3
301: 2024/08/27(火)09:22 AAS
5chはcp932キメ打ちでポストすることになっているっぽい。
なので、cp932に変換できる文字はcp932に、できない文字は実体参照に置換してポストしている。つもり
302: 警備員[Lv.5][新芽] 2024/08/27(火)09:31 AAS
そうなんだ
じゃあその変換が利用者の意図通りか
実態参照がちゃんと扱われるかって問題しかなさそうだね

それから余談だけど
cp932はどの板でも使えるが
utf8は特定の板でしか使えないってことはないかな?
Unicode emojiとしか思えない書き込みもみたことがあるので
baselineが変更されてどんどん上に上がっていく文字列とか
かなり昔にその設定を取得できると聞いた気もするが2ch時代の昔話かもしれん
303: 警備員[Lv.5][新芽] 2024/08/27(火)09:32 AAS
そういう実装ならWindows11で問題が出たのはIMの振る舞いの変更だったんだろうね
304
(1): 2024/08/27(火)12:34 AAS
なんかemacs(29.1)の文字列の扱いに問題があるような気がしてきた。
(length "🛜")を評価すると2になる
305: 警備員[Lv.8][新芽] 2024/08/27(火)12:53 AAS
16bitに収まらないcode pointを持った文字だからでしょうね
306: 警備員[Lv.9][新芽] 2024/08/27(火)14:58 AAS
こういうことですけど
$ echo -n a | iconv -f utf-8 -t UTF16BE | hexdump -C
00000000 00 61 |.a|
00000002
$ echo -n あ | iconv -f utf-8 -t UTF16BE | hexdump -C
00000000 30 42 |0B|
00000002
$ echo -n 🛜 | iconv -f utf-8 -t UTF16BE | hexdump -C
00000000 d8 3d de dc |.=..|
00000004
307
(2): 2024/08/27(火)17:09 AAS
5chがcp932からsjisに変えて不具合から
元に戻すんじゃなくBBS_UNICODEを無効して対応
その後cp932に戻したという話は聞いていないな
1-
あと 83 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.027s