[過去ログ]
【統計分析】機械学習・データマイニング8©2ch.net (1002レス)
【統計分析】機械学習・データマイニング8©2ch.net http://echo.5ch.net/test/read.cgi/tech/1464586095/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
187: デフォルトの名無しさん [sage] 2016/06/13(月) 22:35:39.45 ID:R0RMs4bq データ分析はやっぱり手元で軽く試して可視化までできないと面倒臭いよ 個人の勉強レベルならたいてい小規模な試行錯誤止まりでデスクトップで十分完結するレベルだし http://echo.5ch.net/test/read.cgi/tech/1464586095/187
188: デフォルトの名無しさん [sage] 2016/06/13(月) 22:36:36.39 ID:rH9xeHNR >>186 公開しないのであればローカルでVM動かしたほうが費用も性能も良いんじゃない? http://echo.5ch.net/test/read.cgi/tech/1464586095/188
189: デフォルトの名無しさん [sage] 2016/06/13(月) 22:46:04.11 ID:R0RMs4bq >>188 大規模な分析やるなら一時的にAWSでインスタンスを沢山立てて 早く結果出してすぐ止めるというのはよくある使い方だよ マシン1台でバッチ処理に10時間かけるのも10台使って1時間で終わらせるのも費用は同じだからな 月契約のVPSだとそういう使い方できないからほとんどクラウドのメリットはないけど http://echo.5ch.net/test/read.cgi/tech/1464586095/189
190: デフォルトの名無しさん [sage] 2016/06/13(月) 22:47:21.65 ID:fedZzlGv 機械学習をローカルでやったら、時間かかりすぎでしょ http://echo.5ch.net/test/read.cgi/tech/1464586095/190
191: デフォルトの名無しさん [sage] 2016/06/13(月) 22:52:09.92 ID:fedZzlGv GoogleのCloud Machine Learning使ってる人いる? http://echo.5ch.net/test/read.cgi/tech/1464586095/191
192: デフォルトの名無しさん [] 2016/06/13(月) 22:52:27.53 ID:+VixTmhk 仮想PCはもうlinuxのインストールでつまづいた http://echo.5ch.net/test/read.cgi/tech/1464586095/192
193: デフォルトの名無しさん [sage] 2016/06/13(月) 22:55:38.24 ID:fedZzlGv >>192 VirtualBoxをダウンロードしてきて、 ここからVHD落とせば、インストールする必要ないよ https://www.ubuntulinux.jp/download/ja-remix-vhd http://echo.5ch.net/test/read.cgi/tech/1464586095/193
194: デフォルトの名無しさん [] 2016/06/13(月) 23:33:32.61 ID:1ohehUTc >>186 は魅力的な気がする 自分の案だと箱代に三万円かかってしまうけどこの方法だと半年六千円で済む 日本の都市部では場所代が高いけどその心配もない バッテリーが爆発する心配もない トイレでテストランすることもできる 問題は出力をどうするか?だと思うけど tensorboard等で済むなら検討する価値ありでは? 面倒くさいかな? クラウドに持っていった時には避けられない問題なので二度手間にはならないかも http://echo.5ch.net/test/read.cgi/tech/1464586095/
194
195: デフォルトの名無しさん [sage] 2016/06/14(火) 00:03:37.77 ID:FEt974t9 最初は普通に AWS でやればいいじゃん… http://echo.5ch.net/test/read.cgi/tech/1464586095/195
196: デフォルトの名無しさん [sage] 2016/06/14(火) 01:48:54.46 ID:PqQxjTVo このスレはそんなに大量のデータを処理するようなことをやってる人もいるんだな 俺はそれ以前でつまづいてる http://echo.5ch.net/test/read.cgi/tech/1464586095/196
197: デフォルトの名無しさん [sage] 2016/06/14(火) 08:49:59.87 ID:E/X2uVE+ Twitterクロールした結果をmongoDBに格納してる人が多いみたいだけど何で? Sqliteじゃダメなの? http://echo.5ch.net/test/read.cgi/tech/1464586095/197
198: デフォルトの名無しさん [] 2016/06/14(火) 09:51:34.97 ID:WBTeiyy3 >>157 カブドットコム、AIで調査リポート 中小型銘柄を1分で http://www.nikkei.com/article/DGXLASGF09H15_Z00C16A6NN7000/?dg=1 http://echo.5ch.net/test/read.cgi/tech/1464586095/198
199: デフォルトの名無しさん [sage] 2016/06/14(火) 12:30:43.15 ID:GDTle/SJ >>197 ・JSONを無加工で突っ込めるから ・意識高い系の間ではRDBダサい時代遅れみたいな風潮があるから ドキュメントDBはシーケンシャルリードがクソ遅いからデータ分析には向かないよ とりあえずドキュメントDBに溜めとく場合はあとでバッチで列指向DBとかにロードしてから分析にかけるのが定番 http://echo.5ch.net/test/read.cgi/tech/1464586095/199
200: デフォルトの名無しさん [sage] 2016/06/14(火) 12:32:28.46 ID:uCIWlGCy >>197 多くても安心w スキーマレス http://echo.5ch.net/test/read.cgi/tech/1464586095/200
201: デフォルトの名無しさん [sage] 2016/06/14(火) 12:41:47.97 ID:usFCVOE6 twitterってクロールしても、ゴミしかなくね? http://echo.5ch.net/test/read.cgi/tech/1464586095/201
202: デフォルトの名無しさん [sage] 2016/06/14(火) 12:49:45.76 ID:UOEP8MuS MongoみたいなドキュメントDBはWebアプリとかで大量の個別の更新を並列にさばくのに適していて、 ただ溜めるだけならJSONをスキーマレスでそのまま突っ込めること以外にはあまりメリットはないよ 分析を第一に考えるならPostgreSQLのjsonbに突っ込むのがバランスいいんじゃないかな スキーマレスだしSQLの機能性を犠牲にしなくていいし読み出し速いし もっとガチな規模だとRedshiftとかHBaseとかになるけど http://echo.5ch.net/test/read.cgi/tech/1464586095/202
203: デフォルトの名無しさん [sage] 2016/06/14(火) 13:05:11.47 ID:FEt974t9 Spark, Presto とかの分散型で分析するなら MongoDB はコネクタがあるので選択肢の一つにはなるかも 自分は Cassandra 使ってるけど http://echo.5ch.net/test/read.cgi/tech/1464586095/203
204: デフォルトの名無しさん [sage] 2016/06/14(火) 15:56:51.11 ID:Xw3W+KJl >>201 良く気付いたな えらいぞお前 http://echo.5ch.net/test/read.cgi/tech/1464586095/204
205: デフォルトの名無しさん [sage] 2016/06/14(火) 17:06:29.98 ID:Z6F3Hcel Twitterも数年前までは面白いbotがあったけど、いまは何もないな。 http://echo.5ch.net/test/read.cgi/tech/1464586095/205
206: デフォルトの名無しさん [sage] 2016/06/14(火) 22:26:37.72 ID:E/X2uVE+ 参議院選挙期間中は大学教員は政治活動禁止らしいのだが Twitter Botが勝手に政治発言するのは良いよね? https://twitter.com/beliefjustworld http://echo.5ch.net/test/read.cgi/tech/1464586095/206
207: デフォルトの名無しさん [] 2016/06/15(水) 01:14:06.56 ID:si8IeJpA プログラム間違っててもバックプロバケーションは誤差が低下していきやすいのは何でなんだ http://echo.5ch.net/test/read.cgi/tech/1464586095/207
208: デフォルトの名無しさん [sage] 2016/06/15(水) 05:37:12.35 ID:khLjIJ21 >>207 間違いによるんじゃね http://echo.5ch.net/test/read.cgi/tech/1464586095/208
209: デフォルトの名無しさん [] 2016/06/15(水) 22:34:12.83 ID:rC9K6t2a ツイッターネタ: MachineLearning: search results - twitter https://www.reddit.com/r/MachineLearning/search?q=twitter&restrict_sr=on この中ではバックプロパガンダが気になってしょうがない >>208 に一票で関連性は?だけど題名が面白いので Learning to learn by gradient descent by gradient descent https://www.reddit.com/r/MachineLearning/comments/4o50wh/160604474_learning_to_learn_by_gradient_descent/ レディっとはよく知られていているので
もう貼らないけど 興味が持てて短文が多いので英語の学習教材としていいかも http://echo.5ch.net/test/read.cgi/tech/1464586095/209
210: デフォルトの名無しさん [] 2016/06/17(金) 11:49:49.56 ID:DHRGSGv5 これからは人工脳SOINN http://echo.5ch.net/test/read.cgi/tech/1464586095/210
211: デフォルトの名無しさん [sage] 2016/06/17(金) 17:28:44.45 ID:Z9Ymgj5s SOINNをNGに入れることにした http://echo.5ch.net/test/read.cgi/tech/1464586095/211
212: デフォルトの名無しさん [sage] 2016/06/17(金) 20:00:25.05 ID:MxTb5Tiu テスト SOINN http://echo.5ch.net/test/read.cgi/tech/1464586095/212
213: デフォルトの名無しさん [] 2016/06/17(金) 21:09:18.99 ID:oGfcIJpE 活性化関数が曲線だとどの層にどんな影響してんのかよくわかんね http://echo.5ch.net/test/read.cgi/tech/1464586095/213
214: デフォルトの名無しさん [] 2016/06/17(金) 21:19:07.18 ID:9I7kzKqq $◯!NN http://echo.5ch.net/test/read.cgi/tech/1464586095/214
215: デフォルトの名無しさん [sage] 2016/06/17(金) 22:26:36.62 ID:7+eHqEpf >>213 自分で活性化関数を線形にした時とシグモイド関数とかにした時で試してみれば? http://echo.5ch.net/test/read.cgi/tech/1464586095/215
216: デフォルトの名無しさん [sage] 2016/06/17(金) 22:44:14.94 ID:MLohMZBM 交差検証の定義についてですが、たとえばA〜Jに分類される10個ずつ計100個のデータを5分割で検証する場合、 A1〜8、B1〜8…の80個で学習してA9〜10、B9〜10…の20個で評価 … A3〜10、B3〜10…の80個で学習してA1〜2、B1〜2…の20個で評価 とするということで合っていますか? http://echo.5ch.net/test/read.cgi/tech/1464586095/216
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 786 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.024s