【統計分析】機械学習・データマイニング19

[過去ﾛｸﾞ] 【統計分析】機械学習・データマイニング19 (1002ﾚｽ)
上下前次1-新
抽出解除必死ﾁｪｯｶｰ(本家) (べ) 自ID ﾚｽ栞あぼーん

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

471(1): (ﾜｯﾁｮｲ 935d-EqDK) 2018/06/12(火)19:13 ID:iAqg3u7f0(1/4) AAS
そろそろ、wikiみたいな「集合知」って機械学習で置換できちゃうんじゃないかな
どんなマイナージャンルでも、一人が「こういうキーワードでジャンルの情報集積を」って
指定すれば、入門的なハウトゥや歴史的なインデックスまで作れたり
将来的には検索ワードみたいに随時処理でそれらが出力されたりするんだろうけど、
現段階でも、入力された特定キーワードに関する体系立てた知識の集積は可能じゃない？
たとえば、「ホラー題材のギャグ漫画」くらいだと、概要や歴史的サンプルをまとめられたり

474(1): (ﾜｯﾁｮｲ 935d-EqDK) 2018/06/12(火)21:31 ID:iAqg3u7f0(2/4) AAS
>>473
何事かに対して、どういったジャンルに属する話かと判断して、それを総括するフォーマットを
類似記事から引用する学習は可能だと思う
現状でも、Wikiで項目を作る上で「似たような記事」から構成を引用するのが普通だ
そこそこのマイナージャンルでも、テキストとして情報化されてきている
「データ群の前半に集中する情報を要約して『概要』とする」ことや、「年代と頻出で年表的に
フォーマットを形成する」のも可能だと思う
というか、Wikiの各記事においてすでにこういう「情報をまとめる上での構成」ができているんだから
それ自体を機械学習できるはずなんだよ

476(1): (ﾜｯﾁｮｲ 935d-EqDK) 2018/06/12(火)22:16 ID:iAqg3u7f0(3/4) AAS
>>475
「犬と似ている」と「猫と似ている」は、フォーマットとしてほぼ同じ語り口で記事になってると思う
同じようなフォーマットの記事から、頻出単語や構文を教師データとして、関連する情報として
拾うのは単純に機械学習の範囲だと思うけどなぁ
「同じような単語を同じような語り口で記述している記事」が教師データなわけで

478(1): (ﾜｯﾁｮｲ 935d-EqDK) 2018/06/12(火)22:41 ID:iAqg3u7f0(4/4) AAS
>>477
むしろそういう「言及」をデータとして扱わないと機械学習の有効性が意味を持たないと思うよ
「○○は△△という意味で□□である」っていう関連を一つの型として学習する必要がある
それをビッグデータから学ばないと、各データを統合で結ぶだけの古典的計算機に過ぎない

上下前次1-新書関写板覧索設栞歴

ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ

ぬこの手ぬこTOP 0.039s