[過去ログ] 【統計分析】機械学習・データマイニング26 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
171: (ワッチョイ 93f1-y1nD [157.107.8.150]) 2019/10/09(水)22:40 ID:+iZUlLJa0(2/2) AAS
わかんない
172: (ワッチョイ 0bda-jw9j [121.118.80.163]) 2019/10/09(水)22:44 ID:zMnGtdTv0(1) AAS
アホ
173: (アウアウエー Sae3-G1PU [111.239.59.242]) 2019/10/09(水)22:58 ID:Qjd49VQKa(1) AAS
現実問題として、測度論まで必要になることはあるかなあ?
まずは連続量ではなくて離散量での理解が先かと思われる
それならそんなに難しくないでしょ
174: (ワッチョイ 9bda-+sb9 [223.217.165.240]) 2019/10/10(木)00:11 ID:O5ET7Lyz0(1/4) AAS
規定関数の概念と関数のノルムさえ理解していればいらん。
175: (ワッチョイ 9bda-+sb9 [223.217.165.240]) 2019/10/10(木)00:11 ID:O5ET7Lyz0(2/4) AAS
逆にそれがわかってない研究者はくそ
176: (ワッチョイ 9bda-+sb9 [223.217.165.240]) 2019/10/10(木)00:14 ID:O5ET7Lyz0(3/4) AAS
それ=『規定関数の概念と関数のノルム』な。
177: (ワッチョイ 9bda-+sb9 [223.217.165.240]) 2019/10/10(木)00:17 ID:O5ET7Lyz0(4/4) AAS
わら。×規定
自分がわかってませんでした。
178: (トンモー MM59-d/3+ [210.142.95.200]) 2019/10/10(木)02:31 ID:eF+ihzDEM(1) AAS
グレブナー基底は重要だな
179: (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)06:52 ID:H/x/U9NKM(1/4) AAS
>>160
勉強のためにスクラッチで書くならpythonがオススメ。ネットに情報が多いから
仕事のためならC一択
180
(1): (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)06:53 ID:H/x/U9NKM(2/4) AAS
>>169
何故そこでcolabが出さない
181: (アウアウカー Sa51-CdT3 [182.251.153.117]) 2019/10/10(木)10:19 ID:xGOoNgUAa(1) AAS
統計学を理解できていないのに理解したと思い込んだ人はこういう頓珍漢なことを平気で言い出す

@Inetgate:
@usukutilife @u874072e 一般的な統計処理において、標本数が30を超える場合には正規分布を仮定できますが、
えん さんが調べた結果だと全然正規分布になってないので、食べログの数値操作疑惑、真っ黒じゃねーかと。

Twitterリンク:Inetgate
Twitterリンク:5chan_nel (5ch newer account)
182: (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)10:23 ID:H/x/U9NKM(3/4) AAS
母集団の分布が正規分布に従うと"仮定"すれば、間違ってない意見だな
仮定すれば
183: (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)10:25 ID:H/x/U9NKM(4/4) AAS
って、もとのグラフをみたらbin数がやばかった・・・
184
(2): (アウアウエー Sa13-NJTS [111.239.59.242]) 2019/10/10(木)14:07 ID:9SEfnsqfa(1) AAS
標本抽出の仕方がランダムサンプリングで
母集団が正規分布の時だけに成り立つことを言っているな
185
(1): (ワッチョイ 0da5-X53N [42.127.86.111]) 2019/10/10(木)18:30 ID:7gKn5Xz20(1) AAS
競馬あてて見たいんだけど特徴量として前5走を使いたいんだけどどんな実装にすればいいのかな
どなたかヒントいただけないでしょうか
186
(1): (ワイーワ2 FF93-1wBF [103.5.142.122]) 2019/10/10(木)18:50 ID:i+8+28k+F(1) AAS
前走の結果より血統でやった方が良いって先輩は言ってた
187
(1): (ワッチョイ e377-vt6R [115.38.57.104]) 2019/10/10(木)18:56 ID:cL0M7hVK0(1) AAS
入力で与えるのが出馬一覧とかで順番の意味を無くしたいならPointNetとかの構造を真似したりすればいいんじゃない
188: (ワッチョイ 9501-o74w [126.25.129.72]) 2019/10/10(木)21:27 ID:aZnaY5Is0(1) AAS
>>180
あれ、逆にわかりずらいと思うんだが。
環境設定がすげーわかりずれーわ。
189
(1): (アウアウエー Sa13-NJTS [111.239.56.45]) 2019/10/10(木)23:11 ID:bdrwblpoa(1) AAS
>>185
ググればソースコード付きでいろいろ出てくるが
190
(1): (ワッチョイ cb10-vzjJ [153.131.102.129]) 2019/10/11(金)08:18 ID:mCGV3tUv0(1) AAS
>>184
中心極限定理の話しで
標本数を30にした平均値の分布は
元の分布に関係なく正規分布とみなせるって事だよな

食べログの分布もその分布から標本を30取り出して
平均値を求める操作を10000回繰り返して
平均値の分布を描くと正規分布に近くなるはず
191: (ワッチョイ 0da5-X53N [42.127.86.111]) 2019/10/11(金)11:53 ID:BrwAZKhG0(1) AAS
>>186
血統も絡めてるよていだけど、前走も大事かなと思いまして。

>>187
前走ではAの馬に負けてるから今回も厳しそう、とかの特徴を抽出したいなと思いまして、順序はそれなりに大事なのかなと考えています。

>>189
巷にあるコードよりも、より順序を重視する方法が無いものかなと。

数値やカテゴリーなどの特徴ではなく、多次元特徴を一つの特徴量として扱うことができないかなという感じです。
192: (ワイーワ2 FF93-1wBF [103.5.142.233]) 2019/10/11(金)11:58 ID:hkXt1GtmF(1) AAS
重量ハンデは?
193: (アウアウクー MMe1-o74w [36.11.225.81]) 2019/10/11(金)14:41 ID:uWNk0GcMM(1) AAS
アルバイトでデータ解析やってる人間の意見としては、
とにかく役立ちそうな特徴量を選択せずにぶち込めるだけぶち込んで、
一度xgbかcgbを回してみればいいんじゃない
そうすれば重要な特徴量が何か抽出できるでしょ
話はそれからよ

勝ち馬をよく当てる人が何を大切にしているか調べることからはじめるべき
194: (ワッチョイ 7dda-C28+ [114.187.197.203]) 2019/10/12(土)10:11 ID:UGc1lgsI0(1) AAS
馬を株の銘柄に置き換えてリターンとリスク(分散)を元に
共分散使って有効フロンティアの曲線を引いて
無差別曲線と接する部分の比を見てパーセンテージの高い順に馬を買うってのは?
195
(1): (ワッチョイ 653c-b92j [118.240.95.156]) 2019/10/13(日)00:20 ID:kaSZg9r20(1/11) AAS
>>184
すでに指摘されているが、母集団の分布は正規分布である必要はない

>>190
中心極限定理の話(前半の話)はそうだけども、後半の部分は何が言いたいのかよく分からない

食べログの評点は一人当たり整数値の1~5を付けられる(ある店舗における点数分布をAとする)
各店舗は添付ごとにN人の評価の平均を平均点として算出する(各店舗の平均点分布をBとし、これが話題となっている分布)

Aの採点を行うのが一般人であると仮定すると、各店舗は同一の母集団確率分布に従うものと仮定でき、各店舗の確率変数X1, X2, …, XNは同一の母集団確率分布からのランダムサンプルと考えられる
大数の法則により、標本平均(分布Bのこと)は母集団の平均に近づき正規分布になる

標本数30以上というのはNが30以上ということで、この部分は残念ながら自明ではない
ある焼肉屋の評価は67件から構成されているが、別の焼肉屋は2件となっている

つまり最大限「食べログ」を擁護するのであれば、標本数が30以上ではないため前提条件が間違っている、ということだろうか
196
(1): (アウアウカー Sa51-CdT3 [182.251.152.98]) 2019/10/13(日)00:57 ID:0ePwtCDKa(1) AAS
各店の平均化する前の採点が同一母集団に従うという仮定に無理がありすぎる
例えばラーメン屋とスイーツ店の採点者が同じ傾向の採点するなんて仮定は不自然
197: (ワッチョイ 653c-3Hkb [118.240.95.156]) 2019/10/13(日)00:59 ID:kaSZg9r20(2/11) AAS
>>196
すまん、焼肉屋しか見てなかった
実にその通り
198: (アウアウウー Sac9-KA+R [106.161.128.168]) 2019/10/13(日)06:54 ID:ObLeezZqa(1/2) AAS
>>159
Juliaでしょう。
199: (アウアウウー Sac9-KA+R [106.161.128.168]) 2019/10/13(日)06:56 ID:ObLeezZqa(2/2) AAS
>>160
Flux
200: (ワッチョイ cb10-vzjJ [153.131.102.129]) 2019/10/13(日)07:21 ID:Fxu1r5BT0(1/8) AAS
>>195
大数の法則は標本数を増やすと標本平均が母平均に近づくということ

中心極限定理は平均値の分布に関する定理
食べログの評価の数が30になった時点で平均値を計算して
一度リセットするのを繰り返す
その平均値の分布は正規分布に近づく

今の評価の分布がその店に行く人の評価の分布を表している
のであれば今の評価分布から30標本を取って平均値を求める
操作を復元抽出で繰り返しても同じような結果になるだろう
1-
あと 802 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.015s