統計解析R たぶんpart3くらい (587レス)
統計解析R たぶんpart3くらい http://mevius.5ch.net/test/read.cgi/tech/1340339592/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
レス栞
118: デフォルトの名無しさん [sage] 2015/09/01(火) 10:36:16.50 ID:FCO6+VHV >>116 コンピュータ言語だと思うから、そのような感想が出てくるのでは? 統計ソフトウェアのマクロ機能と認識したらいい。 http://mevius.5ch.net/test/read.cgi/tech/1340339592/118
156: デフォルトの名無しさん [] 2017/05/05(金) 11:12:35.50 ID:E/UcmmKD それな http://mevius.5ch.net/test/read.cgi/tech/1340339592/156
209: デフォルトの名無しさん [sage] 2018/03/27(火) 23:23:26.50 ID:88y58jW2 エクセルソルバーのGRGみたいな非線形最適化制約有りをやりたいんだけど、Rでもできる? http://mevius.5ch.net/test/read.cgi/tech/1340339592/209
265: デフォルトの名無しさん [] 2019/04/13(土) 23:21:10.50 ID:VsnrGDId * [TF-IDF in a nutshell](https://www.reddit.com/r/LanguageTechnology/comments/bb5bcr/tfidf_in_a_nutshell/) [TF-IDF](https://en.wikipedia.org/wiki/Tf%E2%80%93idf) が覚えられないので [PMI](https://en.wikipedia.org/wiki/Pointwise_mutual_information) と関連付けてみる \newcommand{\nwd}[2]{\sharp\left\{{#1}\to{#2}\right\}} $X$を単語の有限集合、$Y$を文書の有限集合とする データを単語から文書への [二部グラフ](https://en.wikipedia.org/wiki/Bipartite_graph)として見て 辺の統計を考える | 記号 | 日本語の記号 | |:--|:----------------------------------| | $\nwd{x}{y}$ | 単語$x$の文書$y$での出現頻度 | | $\nwd{x}{*} := \sum_{y\in Y}\nwd{x}{y}$ | 単語$x$の全文書での出現頻度 | | $\nwd{*}{y} := \sum_{x\in X}\nwd{x}{y}$ | 文書$y$の長さ | | $\nwd{*}{*} := \sum_{x\in X,\; y\in Y}\nwd{x}{y}$ | 全文書の長さ | $$ \frac{P(x,y)}{P(x,*)P(*,y)} := \frac{\cfrac{\nwd{x}{y}}{\nwd{*}{*}}} {\cfrac{\nwd{x}{*}}{\nwd{*}{*}}\cfrac{\nwd{*}{y}}{\nwd{*}{*}}} = \underbrace{\frac{\nwd{x}{y}}{\nwd{*}{y}}}_{\approx\mathtt{TF}} \underbrace{\frac{\nwd{*}{*}}{\nwd{x}{*}}}_{\approx\mathtt{IDF}}. $$ http://mevius.5ch.net/test/read.cgi/tech/1340339592/265
272: デフォルトの名無しさん [sage] 2019/05/13(月) 11:40:45.50 ID:hGBx9p/3 >>271 そうですね、では貼っておきます。 str <- "10.5万人" res <- as.numeric(stringr::str_extract_all(str,pattern = "[0-9.]+")) http://mevius.5ch.net/test/read.cgi/tech/1340339592/272
360: デフォルトの名無しさん [sage] 2021/04/12(月) 12:23:35.50 ID:e0XaXu1M また髪の話してる・・・ http://mevius.5ch.net/test/read.cgi/tech/1340339592/360
376: デフォルトの名無しさん [sage] 2021/05/11(火) 02:38:59.50 ID:Y2pGc4AX 残念ながら多倍長数への変換の自動化は無理そうだ 手作業で一つひとつ変換するとなると直接手作業で四捨五入したほうがずっと早いしミスも少ない Rで実用的な四捨五入は不可能なのだろうか http://mevius.5ch.net/test/read.cgi/tech/1340339592/376
378: デフォルトの名無しさん [sage] 2021/05/13(木) 21:08:11.50 ID:WceB4CAD text2bigqなんてよく考えつくなあ これ引数のクオーテーション無くてもいけるね それなら2.85e-1でも通る ただ数値によって桁あふれのエラーが出るのが難点だね 丸め桁に対して数値の桁数が十分多いときは分岐して普通にroundすればいけるのかな? http://mevius.5ch.net/test/read.cgi/tech/1340339592/378
397: デフォルトの名無しさん [sage] 2021/06/24(木) 19:35:28.50 ID:zSqJWO4e 最新のggsaveはデフォルトがragg出力になってかなりきれいになってた いい感じ 同じ条件で比較 https://i.imgur.com/5UOzASY.png https://i.imgur.com/sFisKxS.png http://mevius.5ch.net/test/read.cgi/tech/1340339592/397
403: デフォルトの名無しさん [] 2021/07/04(日) 14:19:14.50 ID:HlOj3EiR 書けるかな?書けたら話をぶった切ってごめん。who_max_hとge_hは個別に 覚えるより、次の関数から芋づる式に覚えた方が安上がりかもしれない。 ニョロニョロニョロ ドット ハスケル max_h h a b = h * log (exp (a / h) + exp (b / h)) min_h h a b = - max_h h (- a) (- b) ニョロニョロニョロ max_hの低温極限はRのpmaxになる。関数 reduce_max (h, x) := reduce (.init = - Inf, .x = x, .f = max_h)は log_sum_expと呼ばれ、低温極限がRのmaxになる。reduce (0, x, +)にsumを 使うのと同じで、"モノイドはreduceしとけ"パターンの1つになっている。 reduce_max (h, x)をxについて微分すると、soft_maxになり、低温極限がRの which.maxをワンホットで表したものになる。コードではsoft_maxをwho_max_h と書いている。関数max_zero (h, x) := max_h (h, x, 0)の低温極限はreluの 有限温度版にあたるsoft_plusと呼ばれる。max_zero (h, x)をxについて微分 すると、シグモイド関数になる。コードではシグモイド関数をge_hと書いている。 ge_h (h, x)をxについて微分すると、Rのdlogisになる。どの関数も低温極限で デジタル的な関数になり、アルゴリズム的な描像を与える。 温度hをプランク定数だと思うと、マスロフの脱量子化という言い方も理解できる。 シグモイド関数はフェルミ分布関数とも呼ばれるが、対となるボース分布関数は zero_maxの逆写像を微分して得られる。ボース分布関数を使っても、 ヤコビの三重積経由で、また別の低温極限が四捨五入になる関数が作れる。 reduce_maxの連続版はlog_integral_expとなるが、reduce_minの連続版は ラプラス近似と呼ばれる。ラプラス近似の補正第一項を正規分布にとることが 多いので、max_zeroが正規分布に対応すると見ることもできる。また、 max_zero (h, reduce_max (h, x))をxについてルジャンドル変換すると、 soft_maxの負のエントロピーになる。 おしまい http://mevius.5ch.net/test/read.cgi/tech/1340339592/403
471: デフォルトの名無しさん [] 2023/02/26(日) 00:14:58.50 ID:Qcp1BikG 上のコード`uncertainly`の挙動を"プロミスの罠"と書くことにする。 ここでの"プロミス"は、JSの"プロミス"ではなくて、Rでの"変数"の 実装方法を指す。 * [6 Functions | Advanced R](https://adv-r.hadley.nz/functions.html) この記事には次の一節がある。 > You cannot manipulate promises with R code. Promises are like a **quantum state:**: ... 多分、ここでの"量子状態"はハイゼンバグと同じ現象を指しているんだと思う。 観測すると、状態が変化してしまう。 関数`do.call`自体はプロミスの罠と関係しないと思う。 ``` {r a_28697, dependson = ""} do.call (`+`, list (1L, 2L)) ``` Pythonだと次のコードに対応する。 ``` {python a_10786, dependson = ""} (lambda x, y: x + y) (* range (1, 3)) ``` 殆どのプログラミング言語で、関数の引数リストは [一級市民](https://en.wikipedia.org/wiki/First-class_citizen) でないように思う。一級市民でない代わりに、一級市民の配列からの変換が 用意されている。Pythonでは`*`という関数がビルトインで用意されている。 Rでは引数リストを直接作れるかもしれないが、`do.call`で配列から 変換するのが一般的だと思う。 http://mevius.5ch.net/test/read.cgi/tech/1340339592/471
487: デフォルトの名無しさん [] 2023/03/30(木) 00:49:00.50 ID:7ArmqfaI def none (): #{ a = numpy.random.choice (8, 2 * 8, replace = True) b = a + 4 def go (pred, zipper): #{ (j, k) = slow_matches (pred, zipper) (a, b) out = pandas.DataFrame ({"a" : a [j], "b" : b [k]}) print (out) #} go (lambda a, b: a == b, itertools.product) go (lambda a, b: a == b, lambda a, b: itertools.islice (zip (a, b), 1)) go (lambda a, b: abs (a - b) <= 1, itertools.product) go (lambda a, b: abs (a - b) <= 1, lambda a, b: itertools.islice (zip (a, b), 1)) #} none (); ``` `dplyr::xxx_join`の数々のオプションは理解できていないが、`NA`絡み以外は、 コールバック`pred`と`zipper`でかなりカバーしてるんじゃないかと思う。 ジョインの操作自体は明朗会計だが、実行時性能がボッタクリ価格に転嫁される というプログラミング社会が抱える構造的な問題が反映されている。 おしまい http://mevius.5ch.net/test/read.cgi/tech/1340339592/487
542: デフォルトの名無しさん [sage] 2023/08/25(金) 14:03:48.50 ID:HPTKrBcu pythonは何故かPCでJupyter notebookが不具合で使えなくてな 導入時点でコケるとその言語をやる気失くす…Rはその点、導入が簡単で良かった http://mevius.5ch.net/test/read.cgi/tech/1340339592/542
メモ帳
(0/65535文字)
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
1.163s*