[過去ログ] 【統計分析】機械学習・データマイニング20 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
572: (アウアウエー Sa4a-Om/S) 2018/09/25(火)04:07 ID:IDRi2Kjza(1) AAS
>>570
仮に他人の論文があっても実現はできないと言ってるように聞こえる。
個人でできる範囲で成果を取った方が有益かもね。
573(1): (アウアウウー Sa25-wHMa) 2018/09/25(火)14:23 ID:NL395plNa(1) AAS
回帰における学習でデータ正規化を行った上で得られたモデルを使う場合は学習時の正規化で使った平均・標準偏差を使って入力値を変換しなければいけないと思うんだけど、
scikit-learnの使い方紹介記事とか読むとtrain_test_splitで訓練・テストデータ分離して各々別々にfit_transformで正規化している記事が大半で訓練・テストデータが異なる値で正規化されてしまうことになる
これは訓練・テストデータが大量にあればどうせ平均・標準偏差は変わらないだろうというだけの認識でいいの?
574: 573 (アウアウウー Sa25-wHMa) 2018/09/25(火)17:49 ID:kAi0n2pKa(1) AAS
ごめん、見た記事では多分最初だけfit_transformして次では単にtransformしてたっぽい
それなら何の問題もないな
575: (アウアウエー Sa4a-3cGd) 2018/09/25(火)18:05 ID:MY+XQBfWa(1/2) AAS
>>570
相対性理論とか実証は別の人がやることだってあり得る
論文を出すのはできるんじゃね
それが認められるかどうかは内容次第だし
本当に有益ならリソースを持つ組織が実証するし
必要ならその組織に所属すればいいだけ
576: (アウアウエー Sa4a-3cGd) 2018/09/25(火)18:09 ID:MY+XQBfWa(2/2) AAS
>>573
実際に応用として使用する時に上手く行くかどうかじゃね?
学習に使うサンプルが偏ってたらその値を使って正規化すると
実際に使うときに期待する結果にならないんじゃね?
期待する結果に有意差がなければどっちでも良いんじゃないの?
577(1): (ササクッテロ Sp71-/e2F) 2018/09/25(火)22:06 ID:niBQlr5vp(1) AAS
最近回帰問題解くのがキツすぎて無理やり0〜1に正規化して分類みたいにやるのがいい気がしてきた
578(1): (ワッチョイ 8223-tHrl) 2018/09/25(火)22:39 ID:u+oxJT9H0(1) AAS
>>577
層を厚くすればなんとかなるんじゃないの?
579: (アウアウエー Sa4a-uN3A) 2018/09/26(水)00:52 ID:OKJKpWkba(1) AAS
そろそろ PyTorch が無視できなくなってきたな つ
外部リンク[html]:www.kdnuggets.com
580(1): (ブーイモ MM62-MxRe) 2018/09/26(水)08:37 ID:SJU9UbCQM(1/3) AAS
画像データを分類して教師データを作ろうとしてるんだけど、荒くでいいから自動で分類してくれるソフトないかな。
581(1): (ワッチョイ 2d8a-9DVt) 2018/09/26(水)10:44 ID:3yW6iUgn0(1) AAS
SOM
582: (ササクッテロル Sp71-/e2F) 2018/09/26(水)11:01 ID:UoU/Uwygp(1) AAS
>>578
わからないです
画像の生成モデルで出てきた問題みたいに支配的な領域に適合して細かい構造を予測できないので、分類にしてダイス係数を使おうかと考えていました
583(1): (アウアウウー Sa25-wHMa) 2018/09/26(水)12:18 ID:5WxjrnKia(1) AAS
>>580
自動分類できないから機械学習使おうとしてるのにその前に自動分類してくれとは
584(1): (ブーイモ MM62-MxRe) 2018/09/26(水)13:07 ID:SJU9UbCQM(2/3) AAS
>>583
最終的には自分で見なきゃいけないのは承知してるんだけど、荒く自動分類した後に人が修正って考えてます。
何とか教師データの作成を楽したい。
585: (ブーイモ MM62-MxRe) 2018/09/26(水)13:09 ID:SJU9UbCQM(3/3) AAS
>>581
ちょっと調べてみます。
586: (ブーイモ MMb6-MiFZ) 2018/09/26(水)14:20 ID:iQ/1ta8NM(1) AAS
>>584
qtクラスタリングとかどうよ?
587: (ワッチョイ 8223-coYL) 2018/09/26(水)14:48 ID:nIEdWeYp0(1) AAS
画像にキャプション付けてくれるサービス探したらありそうだけど
588(1): (ワッチョイ 8667-SLjp) 2018/09/26(水)17:42 ID:/NSmYwyE0(1) AAS
googleが人間にゴリラってタグ付けてたの思い出した
589: (ブーイモ MMed-7r02) 2018/09/26(水)18:41 ID:IVfMWxLtM(1/2) AAS
>>588
当欠だな
590: 589 (ブーイモ MMed-7r02) 2018/09/26(水)18:42 ID:IVfMWxLtM(2/2) AAS
s/当欠/凍結/
591: (ワッチョイ c923-Czqz) 2018/09/26(水)23:13 ID:Lv/+nPmY0(1) AAS
あの画像なら人間でも間違えるから仕方ない
592(1): (ワッチョイ 65a5-tCrn) 2018/09/26(水)23:34 ID:KPLU+0tA0(1) AAS
SVCのモデルを作る時にMinMaxscalerでスケール変換して、GridSearchCVでインスタンス作って、それに対してスケール変換した訓練データを使って学習させるって事をやったんだけど、これはダメらしいんだけど前処理の前に交差検証しろっていうのがよく分からない。
交差検証の過程では分割されたデータの一部が訓練用、残りがテスト用になって、訓練用となった部分を用いてモデルを学習させて、テスト用はモデルに対しての評価に使われる。
ここまでは大体分かる
しかし実はスケール変換する際にテスト用となった部分に含まれてる情報を使ってしまってる。
このようなデータはモデルに対してまったく新しいデータとは本質的に異なる。
???訓練用の一部がテスト用になるから??
593: (ワッチョイ 9fe7-sLUx) 2018/09/27(木)09:27 ID:sw1sA5ZZ0(1) AAS
>>592
スケール変換の際にテストデータの情報を使ってしまったら、そのテストデータは「まったく新しいデータ」とは言えない。
594(2): (ワッチョイ 971e-ZVm4) 2018/09/27(木)11:10 ID:TDX1lgSt0(1) AAS
qiitaは機械学習の良い記事があっても全然ランキング入らなくなったな
ニワカが飽きたのか
595: (ブーイモ MMbf-wjEJ) 2018/09/27(木)11:20 ID:je3kizhWM(1) AAS
>>568
pythonはプログラム言語でtensorflowやkerasは効率よく機械学習するためのライブラリ。
596: (アウアウウー Sadb-VGrh) 2018/09/27(木)12:14 ID:PZBFougTa(1) AAS
>>594
それならいい記事見つけたらここにでもURL貼ってほしい
qiitaはタイムラインから良記事探すのが難しい
597: (アウアウエー Sadf-QmoO) 2018/09/27(木)22:08 ID:wuMHpvCna(1) AAS
>>594
飽きたというよりも具体的な恩恵が得られないからモチベーションが続かないのでしょう
趣味でやっている人たちばかりじゃないから
598: (ワッチョイ 5723-qD32) 2018/09/27(木)22:17 ID:JFP1gXlP0(1) AAS
英語で検索した方が有用な情報多いよ
599: (ワッチョイ 971e-ZVm4) 2018/09/28(金)00:38 ID:ofrlpy9E0(1) AAS
いいね!稼ぎじゃはてな民くらいしか喜ばないしねぇ
600: (ワッチョイ 57c3-LqEF) 2018/09/28(金)03:48 ID:tygoHNB90(1) AAS
確かにQiitaは最近いいね減ったな
601(2): (ワッチョイ ff81-wjEJ) 2018/09/28(金)05:57 ID:f7OuEx/00(1) AAS
aidemyとpyqどっちで勉強したらいいですか?
上下前次1-新書関写板覧索設栞歴
あと 401 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.024s