[過去ログ] 【統計分析】機械学習・データマイニング26 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
177: (ワッチョイ 9bda-+sb9 [223.217.165.240]) 2019/10/10(木)00:17 ID:O5ET7Lyz0(4/4) AAS
わら。×規定
自分がわかってませんでした。
178: (トンモー MM59-d/3+ [210.142.95.200]) 2019/10/10(木)02:31 ID:eF+ihzDEM(1) AAS
グレブナー基底は重要だな
179: (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)06:52 ID:H/x/U9NKM(1/4) AAS
>>160
勉強のためにスクラッチで書くならpythonがオススメ。ネットに情報が多いから
仕事のためならC一択
180
(1): (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)06:53 ID:H/x/U9NKM(2/4) AAS
>>169
何故そこでcolabが出さない
181: (アウアウカー Sa51-CdT3 [182.251.153.117]) 2019/10/10(木)10:19 ID:xGOoNgUAa(1) AAS
統計学を理解できていないのに理解したと思い込んだ人はこういう頓珍漢なことを平気で言い出す

@Inetgate:
@usukutilife @u874072e 一般的な統計処理において、標本数が30を超える場合には正規分布を仮定できますが、
えん さんが調べた結果だと全然正規分布になってないので、食べログの数値操作疑惑、真っ黒じゃねーかと。

Twitterリンク:Inetgate
Twitterリンク:5chan_nel (5ch newer account)
182: (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)10:23 ID:H/x/U9NKM(3/4) AAS
母集団の分布が正規分布に従うと"仮定"すれば、間違ってない意見だな
仮定すれば
183: (アウアウクー MMe1-o74w [36.11.224.230]) 2019/10/10(木)10:25 ID:H/x/U9NKM(4/4) AAS
って、もとのグラフをみたらbin数がやばかった・・・
184
(2): (アウアウエー Sa13-NJTS [111.239.59.242]) 2019/10/10(木)14:07 ID:9SEfnsqfa(1) AAS
標本抽出の仕方がランダムサンプリングで
母集団が正規分布の時だけに成り立つことを言っているな
185
(1): (ワッチョイ 0da5-X53N [42.127.86.111]) 2019/10/10(木)18:30 ID:7gKn5Xz20(1) AAS
競馬あてて見たいんだけど特徴量として前5走を使いたいんだけどどんな実装にすればいいのかな
どなたかヒントいただけないでしょうか
186
(1): (ワイーワ2 FF93-1wBF [103.5.142.122]) 2019/10/10(木)18:50 ID:i+8+28k+F(1) AAS
前走の結果より血統でやった方が良いって先輩は言ってた
187
(1): (ワッチョイ e377-vt6R [115.38.57.104]) 2019/10/10(木)18:56 ID:cL0M7hVK0(1) AAS
入力で与えるのが出馬一覧とかで順番の意味を無くしたいならPointNetとかの構造を真似したりすればいいんじゃない
188: (ワッチョイ 9501-o74w [126.25.129.72]) 2019/10/10(木)21:27 ID:aZnaY5Is0(1) AAS
>>180
あれ、逆にわかりずらいと思うんだが。
環境設定がすげーわかりずれーわ。
189
(1): (アウアウエー Sa13-NJTS [111.239.56.45]) 2019/10/10(木)23:11 ID:bdrwblpoa(1) AAS
>>185
ググればソースコード付きでいろいろ出てくるが
190
(1): (ワッチョイ cb10-vzjJ [153.131.102.129]) 2019/10/11(金)08:18 ID:mCGV3tUv0(1) AAS
>>184
中心極限定理の話しで
標本数を30にした平均値の分布は
元の分布に関係なく正規分布とみなせるって事だよな

食べログの分布もその分布から標本を30取り出して
平均値を求める操作を10000回繰り返して
平均値の分布を描くと正規分布に近くなるはず
191: (ワッチョイ 0da5-X53N [42.127.86.111]) 2019/10/11(金)11:53 ID:BrwAZKhG0(1) AAS
>>186
血統も絡めてるよていだけど、前走も大事かなと思いまして。

>>187
前走ではAの馬に負けてるから今回も厳しそう、とかの特徴を抽出したいなと思いまして、順序はそれなりに大事なのかなと考えています。

>>189
巷にあるコードよりも、より順序を重視する方法が無いものかなと。

数値やカテゴリーなどの特徴ではなく、多次元特徴を一つの特徴量として扱うことができないかなという感じです。
192: (ワイーワ2 FF93-1wBF [103.5.142.233]) 2019/10/11(金)11:58 ID:hkXt1GtmF(1) AAS
重量ハンデは?
193: (アウアウクー MMe1-o74w [36.11.225.81]) 2019/10/11(金)14:41 ID:uWNk0GcMM(1) AAS
アルバイトでデータ解析やってる人間の意見としては、
とにかく役立ちそうな特徴量を選択せずにぶち込めるだけぶち込んで、
一度xgbかcgbを回してみればいいんじゃない
そうすれば重要な特徴量が何か抽出できるでしょ
話はそれからよ

勝ち馬をよく当てる人が何を大切にしているか調べることからはじめるべき
194: (ワッチョイ 7dda-C28+ [114.187.197.203]) 2019/10/12(土)10:11 ID:UGc1lgsI0(1) AAS
馬を株の銘柄に置き換えてリターンとリスク(分散)を元に
共分散使って有効フロンティアの曲線を引いて
無差別曲線と接する部分の比を見てパーセンテージの高い順に馬を買うってのは?
195
(1): (ワッチョイ 653c-b92j [118.240.95.156]) 2019/10/13(日)00:20 ID:kaSZg9r20(1/11) AAS
>>184
すでに指摘されているが、母集団の分布は正規分布である必要はない

>>190
中心極限定理の話(前半の話)はそうだけども、後半の部分は何が言いたいのかよく分からない

食べログの評点は一人当たり整数値の1~5を付けられる(ある店舗における点数分布をAとする)
各店舗は添付ごとにN人の評価の平均を平均点として算出する(各店舗の平均点分布をBとし、これが話題となっている分布)

Aの採点を行うのが一般人であると仮定すると、各店舗は同一の母集団確率分布に従うものと仮定でき、各店舗の確率変数X1, X2, …, XNは同一の母集団確率分布からのランダムサンプルと考えられる
大数の法則により、標本平均(分布Bのこと)は母集団の平均に近づき正規分布になる

標本数30以上というのはNが30以上ということで、この部分は残念ながら自明ではない
ある焼肉屋の評価は67件から構成されているが、別の焼肉屋は2件となっている

つまり最大限「食べログ」を擁護するのであれば、標本数が30以上ではないため前提条件が間違っている、ということだろうか
196
(1): (アウアウカー Sa51-CdT3 [182.251.152.98]) 2019/10/13(日)00:57 ID:0ePwtCDKa(1) AAS
各店の平均化する前の採点が同一母集団に従うという仮定に無理がありすぎる
例えばラーメン屋とスイーツ店の採点者が同じ傾向の採点するなんて仮定は不自然
197: (ワッチョイ 653c-3Hkb [118.240.95.156]) 2019/10/13(日)00:59 ID:kaSZg9r20(2/11) AAS
>>196
すまん、焼肉屋しか見てなかった
実にその通り
198: (アウアウウー Sac9-KA+R [106.161.128.168]) 2019/10/13(日)06:54 ID:ObLeezZqa(1/2) AAS
>>159
Juliaでしょう。
199: (アウアウウー Sac9-KA+R [106.161.128.168]) 2019/10/13(日)06:56 ID:ObLeezZqa(2/2) AAS
>>160
Flux
200: (ワッチョイ cb10-vzjJ [153.131.102.129]) 2019/10/13(日)07:21 ID:Fxu1r5BT0(1/8) AAS
>>195
大数の法則は標本数を増やすと標本平均が母平均に近づくということ

中心極限定理は平均値の分布に関する定理
食べログの評価の数が30になった時点で平均値を計算して
一度リセットするのを繰り返す
その平均値の分布は正規分布に近づく

今の評価の分布がその店に行く人の評価の分布を表している
のであれば今の評価分布から30標本を取って平均値を求める
操作を復元抽出で繰り返しても同じような結果になるだろう
201
(2): (ワッチョイ cb10-vzjJ [153.131.102.129]) 2019/10/13(日)07:23 ID:Fxu1r5BT0(2/8) AAS
ある店の評価分布は標本数が多くなっても正規分布になるとは言えない
分散が広くなるのはその店のサービスや品質が安定していない事が原因になりうる
その店の特徴が分布に反映される

同様に店を評価する側の特徴も反映されるだろう
202
(2): (ブーイモ MM89-ToAo [202.214.125.165]) 2019/10/13(日)07:58 ID:S6cUkNQoM(1) AAS
深層学習の凄いことのひとつは特徴量を人が設計する必要がない、と本とかに書いてありますが、どう理解すればいいのか分からず教えてください!

ここでいう深層学習とはニューラルネットのことですか?(線形回帰やSVMと違って説明変数を人間が決めてないから? )
203: (ワッチョイ 8302-o74w [101.142.8.160]) 2019/10/13(日)08:07 ID:A69S9ntC0(1) AAS
レビューを投稿する行動を取る時点で母集団にサンプルバイアス
204: (ワッチョイ 653c-3Hkb [118.240.95.156]) 2019/10/13(日)08:55 ID:kaSZg9r20(3/11) AAS
>>201
言ってることの一つ一つは正しいことは理解できるんだけど、何が言いたいのか理解できないんだ

食べログが評価を操作しているかどうか、は今説明してくれた事を駆使すれば判別できるんだろうか?

あるいは、Twitterの書き込みのおかしさ、は今説明してくれた事を駆使すれば、ココがおかしいと指摘されるんだろうか
205
(1): (アウアウカー Sa51-vt6R [182.251.195.232]) 2019/10/13(日)09:26 ID:vNAU+AUMa(1) AAS
>>201
各店舗の分散は各店舗の分布には影響しても全店舗の平均値の分布には影響しないでしょ
206
(1): (アウアウカー Sa51-CdT3 [182.251.154.80]) 2019/10/13(日)10:08 ID:uKg8mtfTa(1) AAS
中心極限定理はあくまで「同一の母集団から得た独立な確率変数であれば、十分な数の平均値を集めたものの分布が正規分布に近似できる」というもの
全店舗の採点者が同一の基準に従う採点を行うという前提が成り立たなければ成立しない定理
1-
あと 796 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ

ぬこの手 ぬこTOP 0.015s