独立な正規分布の商の分布「コーシー分布」の異常さを可視化
こちらの記事で正規分布の和、差、積、商の分布を可視化しましたが、それを通してコーシー分布はやっぱりおかしいなと思ったので、コーシー分布の振る舞いをもっと詳しくみていこうと思います。
コーシー分布とは?連続な確率分布で、基本的な情報をまとめると以下のようになります。
確率密度関数 \(f(x|x_ ...2つの正規分布(相関あり or なし)の和、差、積、商の分布を乱数生成で可視化
正規分布に従う2つの独立な確率変数を変数変換した分布は、特性関数を使ったり、同時分布とヤコビアンを使ったりして求められます。しかし、変数間の独立性の仮定をとっぱらっただけで急激に難しくなります。なんなら独立性の仮定があっても積、商の分布の導出はかなり難しいです。もっといえば正規分布じゃなく他の分布なら… ...
年末ジャンボだって良い買い方があるはず
年末ジャンボに向け、一攫千金を得るためにこれまで培ってきた統計学の知識を活用する時が来ました。
既存戦略を踏まえ、何かいい方がないか探っていきたいと思います。
前提本件では2022年に開催された「年末ジャンボ宝くじ」(第945回 全国自治宝くじ)の設定のもとで話を進めます、具体的には以下の ...
多重共線性とサンプルサイズの関係
多重共線性、通常 “マルチコ” について、名前は良く聞くし、なんだかよくないものだということは知っているけど、それが起きる原理や結果の解釈をどうすればよいのかよくわからない、という方は多いのではないでしょうか。私もその一人です。
Nospareさんの記事を拝見した所、多 ...
統計検定1級 応用 人文科学対策
2022年11月20日に実施された、統計検定1級の試験を受けました。
結果は、数理統計は不合格、応用分野の人文科学は合格、でした。
2022年の人文科学の問題は、問題自体の難易度はそこまで高くなく、準一級に出る内容と大差ないように感じたのですが、計算量がかなり多かったです。クラスタリン ...
食べログ百名店データから探る都道府県の得意料理
「〇〇系は九州がうまい」「△△系なら北海道」といった具合で、いろんな都道府県で名物料理として広く知られている料理ジャンルがあると思います。それは地理的な特性を活かした産業に関連するものであったり、単純に最初に作ったのがその地域だったりと、さまざまな理由があると思います。
一方で、実は名産を持っているの ...
傾向スコアにおける共変量の選び方について
因果効果(介入効果)を正確に測定しようという因果推論の考え方は、医療・政策決定・マーケティングなど、様々な分野で利用されています。施策の介入のバイアスを補正する、といった表現で聞かれたことがある方もいらっしゃるかもしれません。
例えば、
医療分野であれば、元々の寿命を考慮して、治療 ...
機械学習を使って中古車をお得に買いたい(Pycaret を使った価格予測と解釈)
友人A「MINI CROSSOVER をお得に買いたいんだけど、 AI でなんとかならない?」
なんとかしましょう。
作戦は
カーセンサーで取引されている MINI CROSSOVER(中古車)の価格やモデル情報を取得価格を予測する機械学習モデルを作成
モデルの ...
2022年 M1グランプリの分析と戦略立案
こんにちは。M1コンサルタントのKです。今年もM1の季節がやってきました。
昨年書いた記事が少しだけ反響ありましたので、今年もM1の結果分析と、優勝するための戦略について考えてみようと思います。(年末でドタバタしていて、記事書くの遅くなってしまってすみません。)
昨年と同様、準決勝の採点を ...
縮小推定は本当に縮小するのか
Lasso、Ridge などで知られる正則化を使ったモデル推定は「縮小推定」ともよばれます。なぜこうよばれているかというと、推定パラメータがある値に近くなりやすいように推定する手法だからであり、Lasso と Ridge に関してはこの「ある値」とは0を指します。
Ridge 回帰における最小化問題は ...