[過去ログ] 【統計分析】機械学習・データマイニング21 (1002レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) 自ID レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
869: (アウアウイー Sa45-P9Vx) 2019/01/05(土)17:30 ID:0+KUFWcWa(1/3) AAS
ハングルのテキストマイニングって難しいんよ。
日本語の様にはいかない。言い換えれば出来ることは少ない。そのままでは・・。

なもんで日本語に一度翻訳してから、テキストマイニングをするとか、まともな
解析するにはそういうテクニックもあり得るし、やられている。

日本語のテキストを句読点もなくひらがなで羅列した文章を、テキストマイニング
しなさいとやられてもんにゃ〜、御免こうむるが、ハングルじたいがそういう言語
なんで、相当大変。

ハングルだけでやるときは、辞書が必須なんだろうな・・わからんけど。
じゃないと分かち書きみたいなこともできない。
872
(2): (アウアウイー Sa45-P9Vx) 2019/01/05(土)19:04 ID:0+KUFWcWa(2/3) AAS
>>871
英語が楽なのは分かち書きだけで、それ以降は日本語の方が楽。
だから、日本語で構文解析的なテキストマイニングは行われているが
英語ではほとんど行われていない(あきらめてる)。
米国の有名大学などでもチャレンジしているが、すげ〜時間がかかって
使い物にならないんだってさ。
877
(1): (アウアウイー Sa45-P9Vx) 2019/01/05(土)20:44 ID:0+KUFWcWa(3/3) AAS
>>876
いや、私も、以前にとあるこの分やの高名な方から聞いて、初めて知った
次第なんですよ。その面は日本語の方がしっかりしていてやりやすいと。
英語は同じ単語が異なる品詞として頻発してしまう部分に一つの問題があるらしい。
それを、外語大のやはり有名な(これは言語研究の方で有名)方に話したら
至極納得されていた。なもんで、私もそうなんかと思った次第。

ちなみに中国語は、日本語の難しさと英語の難しさの両方を持っているそう。
見方を変えれば、英語は文法など気にせず、データ量に任せて「えいや〜〜」で
機械学習、AIに任せちゃえ!の方が合っているのかもしれないし、実際そういう
流れですよね。
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.177s*