JustSystems ATOK総合スレ Part105 (435レス)
JustSystems ATOK総合スレ Part105 http://egg.5ch.net/test/read.cgi/software/1746194988/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
33: 名無しさん@お腹いっぱい。 (ワッチョイ f778-pSf8) [sage] 2025/05/10(土) 09:21:52.58 ID:xTJPBxJV0 >>17 ×:(2)awkで行最初の単語を削除しcol2-3.txtに格納 ○:(2)awkで行2/3列の単語を取り出しcol2-3.txtに格納 (5)gsedで"ゔ"を"う゛"に置換 ATOKで単語を登録する場合キーボードでは"ゔ"入力できない -> 「vu」は"う゛" →単語ファイルで登録する場合は"ゔ"でも可能 (8)nkfでmerge.txtをUTF-16/CR変換しDMiME-atok.txtに格納 # UTF-16, CR-LFに変換 nkf -w16 -c merged.txt > DMiME-atok.txt UTF-16はファイルの読み書きや通信を行う場合にバイトの順序として上位バイトから送る(UTF-16BE)と下位バイトから送る(UTF-16LE)がある ATOKはUTF-16LEである(単にUTF-16記述はUTF-16LEを示す) nkfコマンドで -w16 はUTF-16BEである -> しかし辞書ユーティリティで登録できた w http://egg.5ch.net/test/read.cgi/software/1746194988/33
34: 名無しさん@お腹いっぱい。 (ワッチョイ f746-pSf8) [sage] 2025/05/10(土) 20:02:24.13 ID:xTJPBxJV0 >>9 > ORCA Project: 医療辞書 medic.txt ・読み:半角英数字/記号/全角ひらがな混在 ・単語:全角英数字/記号/全角カタカナ/漢字混在 ・文字エンコード:UTF-8 ・改行コード:LF これまでの辞書と異なり単語が全角文字になっている 0.5%ぱーとらんちゅうPB 0.5%パートラン注PB 10mL 名詞 読みを全角変換すると"."が不適切な文字になる 単語の英数字は半角が望ましいと思い以前手作業で変換していて諦めた(当時はexcel利用を思いつかなかった) http://egg.5ch.net/test/read.cgi/software/1746194988/34
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.024s