[過去ログ]
文字コード総合スレ Part11 (1002レス)
文字コード総合スレ Part11 http://mevius.5ch.net/test/read.cgi/tech/1516629503/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
自ID
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
506: デフォルトの名無しさん [] 2018/07/07(土) 01:28:54.42 ID:kLxolQc6 空いてるとこにテキトーにいれてるだけやん 文字コードが連続してないし ひどいマッピングされてるわ http://mevius.5ch.net/test/read.cgi/tech/1516629503/506
508: デフォルトの名無しさん [] 2018/07/07(土) 11:50:18.74 ID:kLxolQc6 ちなみに先に書いた全文検索エンジンでは アイウエオもアイウエオも ガギグゲゴもガギグゲゴも 12345も12345も abcdeもabcdeも 同じ文字コードとして扱ってる つまりどっちでキーワード書いても当たる 見た目(つまりグリフ)が違うだけで同じだからな しかし明治大正昭和平成を????までは やってない すでにいろんなもんでその全文検索エンジンは使われてるが コレで文句がきたことはない つまりだれも気にしてない http://mevius.5ch.net/test/read.cgi/tech/1516629503/508
510: デフォルトの名無しさん [] 2018/07/07(土) 13:49:40.16 ID:kLxolQc6 こんな感じの内容からインデックスやマッチング用のデータが作成される ガギグゲゴ ガギグゲゴ ⇒ カ゛キ゛ク゛ケ゛コ゛ カ゚キ゚ク゚ケ゚コ゚ ⇒ カ゜キ゜ク゜ケ゜コ゜ つまりインデックスやマッチング用のデータを作る前に前処理で一気に痴漢することになる で、キーワードをガギグゲゴやガギギゲゴやカ゛キ゛ク゛ケ゛コ゛にすると カ゛キ゛ク゛ケ゛コ゛で検索することになる つまりこの全文検索エンジンは濁音も半濁音も検索できる超優れものといえるのだ http://mevius.5ch.net/test/read.cgi/tech/1516629503/510
513: デフォルトの名無しさん [] 2018/07/07(土) 15:16:01.20 ID:kLxolQc6 ちなみに客ごとに置換辞書を作ってる 客ごとに要望が違うからな 客によってはいろんな要望をいってくる客もいる その要望に応えるのも仕事だからな で、そのなかに????を置換した例はない 全角にマッピングされてるasciiや半角カナの部分は コレについてほぼ間違いなくみな同じ結論になる それ以外で異なる特殊な部分は結構ある 文字コードでシノニムの部分もあれば、それ以外でシノニムにしたい部分もあったりする それは客の業務に依存する部分になるからな http://mevius.5ch.net/test/read.cgi/tech/1516629503/513
514: デフォルトの名無しさん [] 2018/07/07(土) 15:17:11.21 ID:kLxolQc6 考えるのはキミじゃないワケ キミはただのドカタなワケ わかる? 客と良好な関係を保つには できるだけ、それは仕様ですは避けないといけない そしてそれを低いコストで実現できないといけない なにをしたいのかはっきりといってる部分については こっちから客の業務についてどうこういう必要も理由もないし こんなしょうもないことを実現するためにめっちゃカネかかりますよとかいえるワケもない そういうことだ http://mevius.5ch.net/test/read.cgi/tech/1516629503/514
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
1.576s*