[過去ログ] 【統計分析】機械学習・データマイニング24 (1002レス)
前次1-
抽出解除 レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
リロード規制です。10分ほどで解除するので、他のブラウザへ避難してください。
231
(1): デフォルトの名無しさん (ササクッテロ Spdd-lMmt [126.33.78.134]) [sage] 2019/05/14(火) 08:36:03.29 ID:1t0AuSqNp(1/2) AAS
>>229
その通りだね
データ関連事業は活性化すると思う

国の研究機関はさらにまずいね
データ関連のポジションがなくデータは研究者のサイドワークになっている
海外は米国、欧州、中国はデータ関連のポジションがある
233
(1): デフォルトの名無しさん (ササクッテロ Spdd-lMmt [126.33.78.134]) [sage] 2019/05/14(火) 09:23:38.47 ID:1t0AuSqNp(2/2) AAS
>>232
パーマネントポジションという意味ね
派遣に任せるデータではなくて、博士号を持った研究者による専門チームが各国にある
派遣エンジニアはいくらでも必要だし雇用するけどもそれらを統括して将来構想を戦略的に練るポジションからして存在しない
データ戦略という概念がゼロ
264: デフォルトの名無しさん (ササクッテロ Spdd-lMmt [126.33.78.134]) [sage] 2019/05/15(水) 03:36:42.55 ID:f13FTa5ip(1/2) AAS
>>260
皆がそう思うから新たに人を取らないのは理解している
将来に限界が見えるから投資しないことと、最低限のインフラ整備の投資は別で考えなければならない
今は最低限すらないから相当やばい

これは水道の整備によく似ている
将来は人口が減るから水道設備はいらないと言っているようなものだ

蛇口をひねれば水が出てくるように欲しいデータがすぐ手に入る国と、川まで行って桶で水を汲むようにデータを使えるようにするまでに数日から数カ月かかる国では、研究のスピードがまるで違う

下水が整備されなければ病気が蔓延するように、専門家がデータの健全性を担保せねば、それを使った研究の正確性にも疑問符がつくだろう

研究の質と量を上げるインフラ整備に全く考えが及んでいないため、差はどんどん開くだろう
303
(1): デフォルトの名無しさん (ササクッテロ Spdd-lMmt [126.33.78.134]) [sage] 2019/05/15(水) 20:45:27.71 ID:f13FTa5ip(2/2) AAS
中国酷いというヤツと中国凄いというヤツがいて面白い

中国人研究者の数が多すぎて、論文数が評価軸になるからクソ論文が大量生産されて、査読のためにクソ論文を大量に読まされる被害者がいる

一方で欧米の大学院はどこにでも中国人がいて、何割かは優秀な中国人がいて、帰国して企業に入って金の力で海外の有名な研究者を呼び寄せて結果を出し続ける研究者もいる

翻訳もBaiduがGoogle超えてるとも聞くし中国を侮るのはどうかと思うが、中国人のお陰で研究というものが陳腐化した印象はある
316
(1): デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/16(木) 01:46:25.67 ID:flS/YdMEp(1) AAS
>>313
統計に落とすなら極値統計学だね
ある期間の中でどのくらいのリスクが発生するかを予測する
ワイブル分布やガンベル分布って聞いたことない?
実際に金融工学のリスク算定に使われている
339: デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/19(日) 13:23:41.59 ID:LoaqJJJ4p(1/2) AAS
>>338
上位はLast Authorの数だから研究室運営力か研究グループが素晴らしいと言うことかな
単発でいい論文を書くと言うよりも、いい論文を量産出来る土壌を作っている人が評価されるランキングだね
345
(2): デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/19(日) 14:57:37.89 ID:LoaqJJJ4p(2/2) AAS
>>343
中国人で日本語がペラペラな人がこれだけ多い中で、どの立ち位置で自分が活躍するか考えた方がいいよ
日本人で中国語が少し話せるくらいなら全く話にならないよ
375
(1): デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/20(月) 02:38:47.72 ID:zK6cmhQap(1/5) AAS
>>367
正常、異常のラベルはあるの?
人が見たら確実に異常と分かるようなものなのかどうかは一応の判断基準かな
人が判断できるなら特徴量の選び方を工夫する、モデルを工夫すれば何とかなる場合もある
人が判断できないなら単なるパワハラ
377: デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/20(月) 03:28:18.57 ID:zK6cmhQap(2/5) AAS
あぁ、実例があるって書いてあった
同業他社がすでにやっているなら原理的には可能かも知れないね
ただ世の中にはプロの囲碁棋士に勝てるAIがあるんだからお前も作れよ言われても厳しいね

あとはまぁオートエンコーダを使ってる理由によるかな
ラベルがないからと言う理由なら仕方ないが、入力が画像ならCNNをネットワークに組み込んだ方が性能が出るし、ラベルがあって特徴量が少ないならXGBoostを試すのもあり
378
(1): デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/20(月) 03:59:25.00 ID:zK6cmhQap(3/5) AAS
>>376
画像から何らかの基準値が作られてそれが識別として利用できないなら基準値を変えることから始める
位置ズレを検出したい、かつ人間なら判断できると言うのであれば、結構な確率でそのようなネットワークは作れると思う

もし位置が重要であるならば、前処理として画像を2値化して白黒にしてしまうのがいい
正常と異常のバランスが悪いので、正常なデータだけを使ってVAEを組むのが良いが、オートエンコーダは検出能力が低いので、正常だけども異常と判断されるように閾値を下げる
異常と検出されたものの中から正常なものを除去するために、異常なデータを水増しして、CNNを組み込んだデータで2値分類をする
こんな感じかな?
383: デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/20(月) 13:29:02.22 ID:zK6cmhQap(4/5) AAS
>>381
積率母関数(Moment Generation Function; MGF)のことでいいかな?
確率変数XのMGFが分かると、E[X^n]が簡単に求まるので係数を除けば
E[X] 平均
E[X^2] 分散
E[X^3] 歪度
E[X^4] 尖度
に使える
387: デフォルトの名無しさん (ササクッテロ Spef-MdQY [126.33.78.134]) [sage] 2019/05/20(月) 21:53:32.51 ID:zK6cmhQap(5/5) AAS
確かに積率母関数を実務で使ったことない

よくある問題としては、正規分布に従う確率分布がn個(X1, ... , Xn)あり、各々二乗して全てを足したY=X1^2+...+Xn^2はどんな分布に従いますか?

答えは自由度nのカイ二乗分布になるんだけども、畳み込みを使って帰納法で解くのと、MGFを使って解くのどっちが簡単かというと、多分MGFのが簡単
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.041s