[過去ログ] テキスト入力専用ツール 「ポメラ」 Vol.10 (1001レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
110: 2010/11/02(火)05:48 ID:1MNU3CjI(1) AAS
>>107
使ってみた。
うちの環境では問題なし、登録単語101個全部正しくテキストへ変換出来てることを確認。
これだけでも何登録してたかのチェックには便利だけど、txt2dicがやっぱ本命かな。
期待して待ってる。
111
(1): 2010/11/02(火)09:45 ID:/bjYFlYQ(1) AAS
勝手Wikiに入れようかと思ったけど
毛色が違う&途中経過共有のための暫定的な参考資料なので新しく作ってみた
誰でも編集できるよん
外部リンク:www36.atwiki.jp
誰かリッチなGUI付きのツールを作ってくれるといいなw
112
(2): 2010/11/02(火)12:10 ID:XQi20Sti(1/4) AAS
DM20の辞書って36KBあるんだ
DM5は12KBしかないよw
入れたらぶっ壊れるかな……怖くてできないや
113: 80 2010/11/02(火)12:23 ID:MWsKq444(1/2) AAS
>>109
ありがとう
10と20で冒頭2バイトがどんな風に違うのか見たかったんだ
これで識別すれば、10と20で共通のツールを作れる訳だから

>>112
10も12KBだから、冒頭2バイト以外は同じかもなー
もしかして徹頭徹尾同じだったりして
初期状態の辞書をうpってくれれば、>>27がDM5も考慮してくれると思う
114: 80 2010/11/02(火)12:33 ID:MWsKq444(2/2) AAS
>>112
補足
>>109の辞書を見たけど、10と同じく
頭2バイトがファイルサイズ+16みたいだから
5の辞書は10と全く同じなんじゃないかな
つまり10対応のツールが出れば5でも使えるんじゃないかと
115: 2010/11/02(火)14:47 ID:XQi20Sti(2/4) AAS
DM5の初期状態の辞書ファイル
外部リンク[dic]:www1.axfc.net
これでいいのかな?
いちおう>>6の手順で初期化してエクスポートしたものです
参考にしてもらえればうれしい
116: 2010/11/02(火)14:53 ID:XQi20Sti(3/4) AAS
ていうかテキストエディタで開いてみたら、

「l/™……………………………………………(以下同じ)」

以外なにも書かれてないけどw
117
(1): 2010/11/02(火)15:27 ID:XQi20Sti(4/4) AAS
ちなみに自分で登録したあとの辞書ファイルには、
いろんな意味不明の文字列が書き込まれていました
118
(1): 2010/11/02(火)19:17 ID:bIYZF98R(1) AAS
>>117
辞書ファイルはテキストじゃなくバイナリなので
意味のある情報を見るにはバイナリエディタを使う

しかし10と同じかと思ったら微妙にサイズが大きいんだなー
当然ヘッダの値は違うけど構造自体は同じようだから
>>107のも固定値を変えてコンパイルすれば使えるんじゃ?
119: 27 2010/11/03(水)01:13 ID:C6cu3JYj(1) AAS
>>118
空の辞書を見た限りではオフセットも同じに見えます。
ほんとに容量しか違わない感じ。

質問が1つ。
DM20だと、'/' 0x2fで始まる読みを登録すると、
'・'(中黒)0xA5として 0x255e に登録されるんだけど、
DM5やDM10ではどうなっていますか?

登録後も'/'になっていますか?
(異なるようなら処理を分けなきゃいけない)
120: 2010/11/03(水)08:13 ID:OlgGSDvs(1) AAS
DM10でも同じだった
スラッシュと中黒をそれぞれ半角と全角で登録したところ
読みは全部半角の中黒(0xA5)に変換された
オフセット情報を格納する場所も同じく0x255E

別にスラッシュが読みとして
弾かれるようになってる訳ではないのに
変な仕様ー

何にしても、多分DM5も同じじゃないかな
て事はどのモデルの辞書も構造は同じって事で、
ごく一部の分岐判定で対応できるね
省2
121: 2010/11/03(水)16:41 ID:gfzlw6pc(1) AAS
バイナリファイルも知らずに開ねえとか抜かすとウチの会社では磔の刑だ
122
(4): 27 2010/11/04(木)03:21 ID:9TybRzmI(1/5) AAS
txt2dicが出来たのでUPします。
とりあえずDM20ではインポートできた。

外部リンク[zip]:www1.axfc.net

・前回(>107)同様、可能ならば各自でソースコードからコンパイルしてほしい。
・実行ファイルもつけたけど、これを実行する際は自己責任でたのむ。
(ウチの環境に蟲がいた場合、責任取れないから)

概要:
 ATOK8のワードリスト形式のテキストファイルをpomeraの辞書ファイル atok.dicに変換します。

■注意
・区切り文字は半角","とtabのみ対応。
省6
123: 27 2010/11/04(木)03:25 ID:9TybRzmI(2/5) AAS
atok.dic の先頭16バイトはファイルヘッダの様です。
0x0000〜3 データ長
0x0004〜7 チェックサム(データ部の全バイトを単純に加算したもの)

チェックサムが合ってないとエラーにされます....
124: 27 2010/11/04(木)03:39 ID:9TybRzmI(3/5) AAS
肝心要のtxt2dicの動作を書き忘れていました。
元となる辞書のユーザ辞書を全てクリアして、指定した辞書ファイルの内容で置換します。
atokの学習内容には手を出していませんので、学習内容はそのまま残ります。

【注意】
 入力ファイルと出力ファイルが同一か否かの判定をしていません。
 同一のファイルを指定するとファイルが破壊されますので御注意ください。

■お勧めの編集手順
 PCの辞書ツールで新規にユーザ辞書を作成し、ここに dic2txtで出力したワードリストを読込ます。
 辞書ツールで編集を行います。
 辞書ツールからテキスト出力したものを txt2dicの入力にします。
省1
125: 2010/11/04(木)05:51 ID:OvFdjV9L(1) AAS
このスレ
ポケコン解析みたいなノリになってるな
126
(1): 2010/11/04(木)07:06 ID:h+ckzryS(1) AAS
上の方で解析難航とか言ってたけど
本当は簡単に出来るんじゃん…
127
(1): 2010/11/04(木)09:02 ID:v0j1rqxR(1/3) AAS
解けた暗号は簡単に思えるが、何の確証もない中を解くのは大変だろう。

ともあれ>>27>>80もお疲れ様。
仕事終わってから、用意しといた辞書データ放り込んでみる。
128
(2): 2010/11/04(木)12:13 ID:2vJfJSgb(1) AAS
>>127
一人でやってると煮詰まるし、発想の転換もできないしね

>>126
このスレで情報交換したからこそだよ
129
(3): 2010/11/04(木)13:12 ID:nrga+/EH(1) AAS
>>128
煮詰まるの意味を理解してねー情弱がいるなw
1-
あと 872 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.014s