nkfってなんだ (337レス)
上下前次1-新
174: 167 2006/03/13(月)10:10 AAS
思い出した。
今更なので、変えてくれという話ではなくて、素朴な疑問なのですが、
「--overwrite」って一般的なもんなんすかね?
GNU sed だと --in-place だったり Perl や Ruby だと -i ですよね。
175: 成瀬 ◆NBGqNARUSE 2006/03/13(月)15:01 AAS
別名の案を考えるのにフィルタ系のコマンドを一通り調べてみたのですが、
* 相当するコマンドが無い
* デフォルトが上書き
がそもそも大多数で、わたしが見つけられたのはPerl/Rubyの-i[=extension]くらいでした。
sedは見たのですが、GNU sedには-i/--in-placeがあるのですか。
--overwriteを用いているのはnkfくらいのようですね。
-iは既存のオプションと衝突しているため使えないとして、
--in-placeを更新するoverwriteにするというのはありだと思います。
というか、--in-place[=SUFFIX] の拡張子を指定してバックアップはわたしも欲しいので、
この方向で実装してみます。
省2
176: 成瀬 ◆NBGqNARUSE 2006/03/21(火)22:55 AAS
2.0.6 beta1 を出しました。
http://sourceforge.jp/projects/nkf/
ところで、今 nkf は -m がデフォルトで有効になっています。
これを、デフォルトで -m0 にしたいと思っているのですが、どう思います?
一応、コンパイルオプションでデフォルト -m / -m0 を切り替えられるようにして、
お茶を濁しつつ変えてしまおうかとも思っているのですけれど。
ちなみに、同様に意図しない変換を引き起こしうる、デフォルトが -X な件は、
--ic / --oc ではデフォルトで -x を含むようにしています。
177(4): 2006/06/03(土)16:36 AAS
SJISで全角'−'記号の0x817CをUTF-8Nの0xEFBC8Dに変換する
オプションを教えて欲しい。
普通にC:\>nkf -S -w test.sjs > test.utf8nとかしても
0xE28892に変換され、他のソフトに読み込むときうまく
読み込まれず苦労しています。
TeraPadで読み込んでUTF-8Nで変換すると0xEFBC8Dに変換されます。
あと、全角の'¥'記号が半角の'\'記号になってしまうのも。
178: 2006/06/04(日)01:42 AAS
人に聞くよりソース読んじゃった方が早くね?
179(1): 2006/06/04(日)10:55 AAS
>>177
nkfのversionは?
iconv使った方がいいかもね。
180(1): 177 2006/06/04(日)17:35 AAS
nkfのVersionはたしか2.07betaだと思う。
Vectorでダウンロードしたやつで、
色んなVersionが同梱されていました。
因みにiconvってWindowsで使えるの?
181: 2006/06/04(日)20:39 AAS
それだとあなたの言う動作になっているね。
2.0の頃は¥のままだったんだけど。
iconvはcygwinに入っているよ。
182(1): 2006/06/04(日)22:30 AAS
--cp932
183(1): 177 2006/06/05(月)08:47 AAS
>>182
nkf -S -w --cp932 infile.sjis > outfile.utf
で望の結果となりました。アリガトウゴザイマス。
184(1): 2006/06/05(月)09:15 AAS
>>137
今更ながらだが、kccのコードを弄って簡易spamフィルタに使ってるぞ。
Subjectに、8ビット文字入れてくる汚物メールを検出するフィルタ。
nkfだとコードがでかすぎて弄れぬ。
185: 成瀬 ◆NBGqNARUSE 2006/06/16(金)03:28 AAS
今更だけどフォロー
>>177 >>183
現在の nkf はデフォルトでは ASCII の範囲はそのまま、
それ以外はJISのマッピングに準拠したマッピングにしています。
Windows の変換と同じ変換、すなわち CP932 互換の変換をしたい場合は、
--cp932 で行うことができます。
なお 2.0.6 では nkf --ic=CP932 --oc=UTF-8 と、iconv っぽく使えます。
>>179 >>180
行う変換がどのマッピングなのか把握しているならば iconv が適当です。
Windows なら香り屋さんのが楽 http://www.kaoriya.net/#LIBICONV
省7
186(1): 2006/12/08(金)02:57 AAS
IDに注目。
なんかうれしい。
187: 186 2006/12/08(金)03:00 AAS
俺はバカだ。ここはUNIX板じゃないか(泣
(ちなみに俺の今の -> "nkf2PDI3")
188: 成瀬 ◆NBGqNARUSE 2006/12/09(土)03:04 AAS
おめw
189(3): 2007/01/19(金)11:03 AAS
バグでしょか? 2.0.7 と CVS 先端で再現します。
1. MIME デコードしたりしなかったりする
% nkf -e
あいうえお =?iso-2022-jp?b?GyRCJCIbKEI=?=
あいうえお =?iso-2022-jp?b?GyRCJCIbKEI=?=
% nkf -e
こんにちは =?iso-2022-jp?b?GyRCJCIbKEI=?=
こんにちは あ
2. UTF-8 だと MIME デコード部分が化ける
% nkf -w
省5
190(1): 2007/01/19(金)12:18 AAS
MIMEのオプションも指定しなきゃだめだよ
191(1): 189 2007/01/19(金)13:37 AAS
>>190
>>190 さんは MIME のオプション指定で再現しなくなりましたか?
NKF 1.9以降は MIME のオプション (-m) はデフォルトで有効になっていると思います。
試しにそれぞれに -m オプションを付けてみましたが、同じ出力結果となりました。
192: 2007/01/20(土)00:07 AAS
nandedaro
kizukebakokanni
fuzisanga...
193: 2007/01/20(土)00:26 AAS
あいうえお =?iso-2022-jp?b?gqA=?=
上下前次1-新書関写板覧索設栞歴
あと 144 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.810s*