文字コード総合スレ Part11

[過去ﾛｸﾞ] 文字コード総合スレ Part11 (1002ﾚｽ)
上下前次1-新
抽出解除必死ﾁｪｯｶｰ(本家) (べ) 自ID ﾚｽ栞あぼーん

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

488(1): デフォルトの名無しさん [] 2018/07/04(水) 23:49:15.94 ID:s7W39adb(1/2) AAS
昔、Unicodeもない時代に全文検索ｴﾝｼﾞﾝ作ったことがあるが
ｲﾝﾃﾞｯｸｽ作るのにもﾏｯﾁﾝｸﾞ用に符号圧縮したﾃﾞｰﾀ作るのにも
設計がめんどいわ処理時間がかかるわだろうから
Shift_JISﾃﾞｰﾀから16bitのﾃﾞｰﾀに一旦変換してからそういったﾃﾞｰﾀを作成するようにしてたわ

要件が検索漏れｾﾞﾛ、ﾉｲｽﾞｾﾞﾛ、なおかつﾒﾃﾞｨｱは超ﾄﾛｲCD-ROMという
ありえない滅茶苦茶な内容だったからな

ｲﾝﾃﾞｸｻは大富豪な設計でないとやってられなかった
ｲﾝﾃﾞｯｸｽ作成にﾘｱﾙﾀｲﾑ性が要求されなかったからまだ救いがあったともいえる

その全文検索ｴﾝｼﾞﾝはｲﾝﾃﾞｯｸｽを大きくすればするほどｲﾝﾃﾞｯｸｽが大きくなるかわりに
最悪のｹｰｽの速度が速くなるという仕様にした（最低限必要な性能の要求水準に応えるため）
ｲﾝﾃﾞｯｸｽを大きくするということはｲﾝﾃﾞｯｸｽを作るのに当然時間がかかるということになる
いまはそれもとてつもなくﾃﾞｰﾀが増えてDVDになってる
ｲﾝﾃﾞｯｸｽもものすごい大きくなってる

で、その最悪のｹｰｽというのは、
符号圧縮されたﾃﾞｰﾀをﾏｯﾁﾝｸﾞする回数が増えることを意味する

ﾏｯﾁﾝｸﾞの条件はﾏｯﾁﾝｸﾞｷｰﾜｰﾄﾞから生成するｲﾝﾃﾞｯｸｽに含まれる符号圧縮された符号の組み合わせになる
そのﾏｯﾁﾝｸﾞｱﾙｺﾞﾘｽﾞﾑにBMHを使うことになる

489: デフォルトの名無しさん [] 2018/07/04(水) 23:50:33.59 ID:s7W39adb(2/2) AAS
で、このBMHというのは文字列ﾏｯﾁﾝｸﾞで非常に有効なｱﾙｺﾞﾘｽﾞﾑといえる
しかしShift_JISでは使えない
ﾕﾆｺｰﾄﾞならそのまんま使える

順方向からの文字列ﾏｯﾁﾝｸﾞですらShift_JISでは
こういった高速なﾏｯﾁﾝｸﾞｱﾙｺﾞﾘｽﾞﾑが使えない

いかにShift_JISがｳﾝｺかよくわかる典型的な例といっていい

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.035s