[過去ログ]
文字コード総合スレ Part11 (1002レス)
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
488: デフォルトの名無しさん [] 2018/07/04(水) 23:49:15.94 ID:s7W39adb 昔、Unicodeもない時代に全文検索エンジン作ったことがあるが インデックス作るのにもマッチング用に符号圧縮したデータ作るのにも 設計がめんどいわ処理時間がかかるわだろうから Shift_JISデータから16bitのデータに一旦変換してからそういったデータを作成するようにしてたわ 要件が検索漏れゼロ、ノイズゼロ、なおかつメディアは超トロイCD-ROMという ありえない滅茶苦茶な内容だったからな インデクサは大富豪な設計でないとやってられなかった インデックス作成にリアルタイム性が要求されなかったからまだ救いがあったともいえる その全文検索エンジンはインデックスを大きくすればするほどインデックスが大きくなるかわりに 最悪のケースの速度が速くなるという仕様にした(最低限必要な性能の要求水準に応えるため) インデックスを大きくするということはインデックスを作るのに当然時間がかかるということになる いまはそれもとてつもなくデータが増えてDVDになってる インデックスもものすごい大きくなってる で、その最悪のケースというのは、 符号圧縮されたデータをマッチングする回数が増えることを意味する マッチングの条件はマッチングキーワードから生成するインデックスに含まれる符号圧縮された符号の組み合わせになる そのマッチングアルゴリズムにBMHを使うことになる http://mevius.5ch.net/test/read.cgi/tech/1516629503/488
490: デフォルトの名無しさん [] 2018/07/05(木) 01:32:31.02 ID:Iw1yLrzA >>488 > インデックスを大きくすればするほどインデックスが大きくなる 髪を長くすればするほどロングになる http://mevius.5ch.net/test/read.cgi/tech/1516629503/490
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
1.366s*