統計学に関係するやつ全般

統計/機械学習

Thumbnail of post image 061
大数の弱法則とは

$n$個の確率変数について$X_1, ~X_2, \ldots, X_n, ~i.i.d. \sim (\mu,~\sigma^2)$であるとき、標本平均$\overline{X}_n := \frac{1}{n}\sum_{i=1}^{n}X_i$、$\mu$、$\forall \epsilon ...

統計/機械学習

Thumbnail of post image 023
はじめに

私は非公式でBREAKING DOWN のコンサルタント、通称BDコンサルをやっている者です。

今回は、「BREAKING DOWNは犯罪を増加させるのか?」という問いに対して、計量経済学の分野で用いられる時系列データ間の因果関係分析の手法を用いて検証してみました。「BREAKING DOWN ...

統計/機械学習

Thumbnail of post image 147

はじめに

広告・マーケティング関係の仕事をされている方は、MarketingMixModeling(MMM)という手法を聞いたことがあるのではないでしょうか。重回帰ベースの手法を用いて広告の効果を計測し、よりよい広告出稿プランに繋げるためのソリューションです。

少し前には、Google×博報堂、Goog ...

統計/機械学習

Thumbnail of post image 098

はじめに

本記事では、統計的因果推論を実行する際に置かれている仮定について書いていきます。

実務においても、傾向スコアやDIDなど、因果推論の手法が使われることはよく耳にしますし、利用されている方も多いと思います。

一方で、実務の現場では、これらの手法が利用できる条件や、因果効果を識別するた ...

統計/機械学習

Thumbnail of post image 186
はじめに

健康のためにバランスの良い栄養素を摂る必要があるのはわかるんですが、必要な栄養素が多くてこの辺の知識に疎い私のような人間にとっては覚えるのはかなり厳しいです。例えば、厚生労働省作成の「日本人の食事摂取基準(2020年版)」は下図のような基準を出しています。

日本人の食事摂取基準(2020 年版), ...

統計/機械学習

Thumbnail of post image 140

はじめに

2023年3月、GoogleからMeridianというMarketingMixModel(以下、MMM)のパッケージが一部公開されました。

Googleは以前からLight weight MMMというライブラリをオープンソースで公開していたので、それが更新された形になります。Meridianが ...

統計/機械学習

Thumbnail of post image 124

はじめに

私は普段、M1コンサルタント・M1サイエンティストをやっている者です。
自分たちでM1優勝を目指す傍ら、M1に出場する芸人さんのコンサルもしています。

毎年やっているM1分析の連載も、早くも3年目となりました。過去には、審査員の評価の相関関係やクラスタリング分析の結果から、M1グランプ ...

統計/機械学習

Thumbnail of post image 071

グラフィカルラッソのハイパーパラメータはクロスバリデーション(CV)でも決めることができます。

この辺は、例えば井出先生がサラッと言及1してたり、論文を漁ると普通に「CVで決めました」などと書かれていますが、日本語で具体的にどうやっているかを書いているものが見当たらなかったので紹介します。また、これを ...

統計/機械学習

Thumbnail of post image 055

線型回帰モデルに対する正則化は、あえて回帰係数にバイアスを持たせることで汎化性能を高めたり、多重共線性の問題を回避したりすることができる技術です。正則化を用いる場合、最小化する損失関数は以下の形になります。

$$\frac{1}{n}\|\boldsymbol{y} – \boldsymb ...

統計/機械学習

Thumbnail of post image 025

回帰分析を題材に、特徴量と目的変数それぞれを標準化するかしないかでどのように結果が変わるかを確認してみます。

なお、標準化の定義は以下の式の通り、平均0分散1にスケーリングするものとします。また、テストデータに対する標準化には学習データで計算された統計量を使うものとします。

$$z_i = ...