全文検索エンジン Hyper Estraier 2 (333レス)
上下前次1-新
抽出解除 レス栞
238(1): 2010/03/26(金)14:41 AAS
 >>231 
 外部リンク[html]:hyperestraier.sourceforge.net 
 バイト単位ではなく文字単位2-gram 
 ただし英語はデフォルトで空白区切り、インデックス作成時に英語も文字単位2-gram指定可能 
 また英語空白区切りでインデックスを作ってもアルファベット一文字の検索は可能、2文字は不可 
  
 こんぐらい教えてやれよ、無能なやつばっかだな 
239: 2010/03/26(金)15:22 AAS
 分かってんならすぐに教えてやれよ、ノロマだな 
  
 という煽りは置いといて、元々の問いは本当にその答えを望んでいたのか? 
 もしそうだとしても、たぶんその答えの前に「HE内部では全ての文字はUTF-8で扱う」という大前提が必要では? 
  
 元々の問い(かどうかも分からない)は、N-gramのアルゴリズムには詳しそうなんだけど、それでいて「日本語は 
 英語の2文字か3文字くらいの情報量がありそう」とか言い出すし、UTF-8のことを知ってそうだけど知らなそうだし、 
 N-gramのアルゴリズムにそれだけ詳しいんならユーザガイドをちらっと読めば>>238の答えはすぐに分かるはずだし 
 ほんと、よく何を言ってるのか分かったね、すごいよあんた >>238 
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.751s*