[過去ログ] 【統計分析】機械学習・データマイニング30 (1002レス)
上下前次1-新
抽出解除 レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
505(1): (ワッチョイ ee73-dxvU [153.200.72.220]) 2021/05/12(水)11:00 ID:lwPC+Em40(1) AAS
我勉強中なんだけど、
「RMSE(平均平方二乗誤差)を使い求まる解は、誤差が正規分布に従うという前提の下で求まる最尤解と同じになる」
これってどういう意味?
508: (ワッチョイ ee73-7ir8 [153.200.72.220]) 2021/05/13(木)09:33 ID:LL50QdoW0(1) AAS
>>506
THX!
やってみるわ
511: (ワッチョイ d073-gSvD [153.200.72.220]) 2021/05/16(日)18:14 ID:BCvV60Hy0(1) AAS
>>510
マジ!?
本番サーバのバッチでも使える?
512(1): (ワッチョイ d073-gSvD [153.200.72.220]) 2021/05/17(月)11:56 ID:AazcJmIk0(1) AAS
「X_train, X_test」の大文字ってどうしてます?
面倒なので小文字にしたいのですが、不都合ありますか?
532(1): (ワッチョイ d073-gSvD [153.200.72.220]) 2021/05/19(水)10:50 ID:V3eiLHp10(1) AAS
pycharm使っている人います?
有料の価値ありますか?
VSCodeを使ってますが、プラグインやカスタマイズが面倒なので、pycharmに乗り換えようかと
ワタシは初学者です
545(1): (ワッチョイ e673-7S+s [153.200.72.220]) 2021/05/21(金)13:48 ID:+DlIiJwi0(1/2) AAS
商品レコメンドをやりたいのですが、pythonでおすすめのライブラリありますか?
データはアクセスログ、クリックログなどの暗黙データです。
調べたところ、レコメンドに関してはライブラリが少ない感じだったので。
implicitパッケージくらい?
548(1): (ワッチョイ e673-7S+s [153.200.72.220]) 2021/05/21(金)16:25 ID:+DlIiJwi0(2/2) AAS
>>547
仕事といえば仕事なんだけど、自宅待機中の勉強ってことで機械学習やってる
会社のためというよりは、転職に備えてという感じなんだ
577(4): (ワッチョイ cf73-PlKh [153.200.72.220]) 2021/06/04(金)10:37 ID:xWxJ1kGR0(1) AAS
人工知能学会の資料に書かれている内容について教えてください。
不動産情報ポータルサイトSUUMOでのデータ活用(※PDFです)
外部リンク:jsai.ixsq.nii.ac.jp
2ページ目 > 3.リコメンドシステム > 3.2従来型アプローチ > 1コンテンツベースフィルタリング
「間取りなど、カテゴリー変数を取り入れる場合、類似度を直接に算出できないため、ログから同時検索される確率を類似度として用いている」
↑上記資料には、このように書かれています。
この「カテゴリー変数は、類似度を算出できない」のは、なぜでしょうか?
順序が無いカテゴリー変数は、隣り合った数値であっても近さを表現できないから、という意味でしょうか?
また「ログから同時検索される確率を類似度として用いる」というのは、具体的にどのような処理が想定されますでしょうか?
(経験不足のためイメージできないもので。。。。)
以上、もしわかる方がお見えでしたらご教授いただければ幸いです。
606: 577 (ワッチョイ cf73-PlKh [153.200.72.220]) 2021/06/06(日)09:45 ID:WALxRzX00(1) AAS
>>578,579,580,582,584
THX!!!
めっちゃ参考になりました!
677(2): (ワッチョイ cf73-9b/0 [153.200.72.220]) 2021/06/10(木)22:27 ID:uEixJvyy0(1) AAS
書籍「Kaggleで勝つデータ分析の技術」の内容について教えてください。
この書籍のサンプルコード内のコメントについてです。
・第4章「分析コンペ用のクラスやフォルダの構成」サンプルコード
外部リンク[py]:github.com
・183行目のコメント抜粋
「# 毎回train.csvを読み込むのは効率が悪いため、データに応じて適宜対応するのが望ましい(他メソッドも同様)」
「効率が悪い」というのは、速度の遅さだと思うのですが、
「データに応じて適宜対応」とは、具体的にどんな対応があるのでしょうか?
CSVからデータベース(mysql)などに移しておく?くらいしか思いつかないもので・・・。
もしお分かりになる方見えましたらお願いいたします。
689: (ワッチョイ cf73-gVNt [153.200.72.220]) 2021/06/11(金)11:48 ID:sZI9zEU+0(1) AAS
>>678,679,680
ありがとうございました!
ご指摘の通り、サンプルコードではクロスバリデーションのフォルダごとにCSVを再読み込みしていました。
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ
ぬこの手 ぬこTOP 0.046s