JustSystems ATOK総合スレ Part105 (394レス)
上下前次1-新
抽出解除 レス栞
15: 名無しさん@お腹いっぱい。 (ワッチョイ d6c7-pSf8) [sage] 05/06(火)18:10:12.98 ID:joKRUHbt0(1)
> 4万2千語の内300語がエラー
これはUTF-16変換(nkf)に誤りがあった -> 全角ハイフンマイナスを半角ハイフンマイナスに変換
・nkfを使用せずメモ帳で書き込み時にUTF-16LEを指定
・読みが全角英文字で単語が半角英文字 -> 日本語変換の意味なし -> 削除
・読みが32文字を超えている場合は32文字以内に収める
上記の対策で辞書ユーティリティで登録したら1個エラーになった -> !!単語に不適切な文字が含まれています。
単語を修正しても改善せず -> 原因は読みに"、"が含まれていた
→!!読みに不適切な文字が含まれています。 エラーにならなかったので気づくのが遅れた
42,254語を登録完了
17(2): 名無しさん@お腹いっぱい。 (スーップT Sd32-pSf8) [sage] 05/07(水)13:02:04.98 ID:2L57a+lOd(1)
DMiME 医学医療用語変換辞書
macのスクリプト
(1)awkで行最初の単語を取り出しuconvで全角変換後col1.txtに格納
(2)awkで行最初の単語を削除しcol2-3.txtに格納
(1)(2)はDMiME-1.1.txtについて全行で行われる
(3)pasteでcol1.txtとcol2-3.txtをマージしmerge.txtに格納
(4)gsedで"短縮よみ"を"短縮読み"に置換
(5)gsedで"ゔ"を"う゛"に置換
(6)gsedで"サジェストのみ"を含む行を削除
(7)gsedで"*"を削除
(4)(5)(6)(7)はmerge.txtについて全行で行われる
(8)nkfでmerge.txtをUTF-16/CR変換しDMiME-atok.txtに格納
(9)col1.txt col2-3.txt merged.txtを削除
330: 名無しさん@お腹いっぱい。 (アウウィフ FF9b-p46g) [sage] 07/06(日)11:29:44.98 ID:pCAKbncCF(1)
なんでこんなに荒れてるんだ
386: 名無しさん@お腹いっぱい。 (ワッチョイ 97f5-HSuF) [sage] 08/02(土)16:50:22.98 ID:IIXzdG9F0(5/5)
レスは
初期状態(インストール後にバックアップ):Win/Mac
学習データの初期化:iOS
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.015s