JustSystems ATOK総合スレ Part105 (394レス)
JustSystems ATOK総合スレ Part105 http://egg.5ch.net/test/read.cgi/software/1746194988/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
15: 名無しさん@お腹いっぱい。 (ワッチョイ d6c7-pSf8) [sage] 2025/05/06(火) 18:10:12.98 ID:joKRUHbt0 > 4万2千語の内300語がエラー これはUTF-16変換(nkf)に誤りがあった -> 全角ハイフンマイナスを半角ハイフンマイナスに変換 ・nkfを使用せずメモ帳で書き込み時にUTF-16LEを指定 ・読みが全角英文字で単語が半角英文字 -> 日本語変換の意味なし -> 削除 ・読みが32文字を超えている場合は32文字以内に収める 上記の対策で辞書ユーティリティで登録したら1個エラーになった -> !!単語に不適切な文字が含まれています。 単語を修正しても改善せず -> 原因は読みに"、"が含まれていた →!!読みに不適切な文字が含まれています。 エラーにならなかったので気づくのが遅れた 42,254語を登録完了 http://egg.5ch.net/test/read.cgi/software/1746194988/15
17: 名無しさん@お腹いっぱい。 (スーップT Sd32-pSf8) [sage] 2025/05/07(水) 13:02:04.98 ID:2L57a+lOd DMiME 医学医療用語変換辞書 macのスクリプト (1)awkで行最初の単語を取り出しuconvで全角変換後col1.txtに格納 (2)awkで行最初の単語を削除しcol2-3.txtに格納 (1)(2)はDMiME-1.1.txtについて全行で行われる (3)pasteでcol1.txtとcol2-3.txtをマージしmerge.txtに格納 (4)gsedで"短縮よみ"を"短縮読み"に置換 (5)gsedで"ゔ"を"う゛"に置換 (6)gsedで"サジェストのみ"を含む行を削除 (7)gsedで"*"を削除 (4)(5)(6)(7)はmerge.txtについて全行で行われる (8)nkfでmerge.txtをUTF-16/CR変換しDMiME-atok.txtに格納 (9)col1.txt col2-3.txt merged.txtを削除 http://egg.5ch.net/test/read.cgi/software/1746194988/17
330: 名無しさん@お腹いっぱい。 (アウウィフ FF9b-p46g) [sage] 2025/07/06(日) 11:29:44.98 ID:pCAKbncCF なんでこんなに荒れてるんだ http://egg.5ch.net/test/read.cgi/software/1746194988/330
386: 名無しさん@お腹いっぱい。 (ワッチョイ 97f5-HSuF) [sage] 2025/08/02(土) 16:50:22.98 ID:IIXzdG9F0 レスは 初期状態(インストール後にバックアップ):Win/Mac 学習データの初期化:iOS http://egg.5ch.net/test/read.cgi/software/1746194988/386
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.024s