Pythonではじめる 会計データサイエンス

ひとこと紹介

Pythonやデータ分析をほぼ知らない人向けに、会計っぽいデータに対して基礎的なデータ分析手法を適用してみたという本。

感想

まず想定読者のペルソナ定義で2ページ割かれており、驚くほど具体的です。そこまで細かくすると必要性がいまいちわかりませんでした、逆に読者を絞りすぎてしまわないのでしょうか。

分析の部分では最初に仮説検定が出てきますが、「効果量」「検出力」に関して一切触れられていません。「対立仮説が正しかった場合に正しく帰無仮説を棄却できる確率」も気にならないでしょうか。

また、数百程度のサンプルサイズのデータに対するクラスター分析が紹介されていますが、階層的クラスタリングではなく初期乱数に結果が依存するk-meansを使用する理由が知りたかったです。クラスタリングを行う際はクラスタ数の決め方が重要だと思いますが、そこももう少し触れて欲しいところです。クラスター分析の結果の解釈はもっと重要だと思いますが、非常に簡単な説明にとどまっていました。

様々な設定に対して分析例を紹介しておりますが、ほぼ全ての例で実データが使われておらず、さらにその内容もいまいち現実的ではありません。欲を言えば、財務諸表でもe-Statでもなんでもいいので、実データに対する分析も載せてほしいなと感じました。

いろいろ述べましたが、実は冒頭のペルソナ定義で「Pythonやデータ分析をほぼ知らない人」を想定読者としています。なので、前述の発言は的外れかもしれませんが、せめて会計データに関してはもう少し詳しい分析事例などが欲しかったと感じました。もしこれが本当に会計データに関する実務レベルのデータ分析なのであれば、ここはデータサイエンティストが入り込む余地があるのではと前向きにも捉えられました。

もちろん、「会計データに関心があるが、データ分析は全く知らない」といった方々にはかなり良い足がかりとなるのではと思います。

おすすめ度

会計データに興味がある完全なデータ分析初心者なら
うーん…
おすすめ
統計や機械学習を用いたデータ分析をやったことがある方なら
うーん…
おすすめ

Posted by S