StatsFragments

Python, R, Rust, 統計, 機械学習とか

岩波データサイエンス Vol.1

ご恵贈いただきました。 ありがとうございます! あわせてタスクもいただきました (下部)。

書籍のコンテンツ

各章ごとの内容は id:sfchaos さんが詳しく紹介されています。

d.hatena.ne.jp

まだ すべて読めていないのですが、以下 3 点がよいポイントだと思います。

  • 理論 と サンプルプログラム 両方の記載がある
  • BUGS, Stan, PyMC3 と主要なパッケージが網羅されている
  • サンプルは単純な回帰だけでなく 時系列 / 空間ベイズを含む

補足 書籍には コラム "Pythonとは" という データ分析視点での Python 紹介があるのですが、中身は結構な pandas 推しでした。著者の方、いったい何者なんだ...。

Stan 入門

依頼により、著者の松浦さんが作成した RStan サンプルの PyStan 版を作成させていただきました。

以下リポジトリの "Example..." フォルダ中に含まれる Jupyter Notebook ( .ipynb ) を開くと、 GitHub 上でプログラムと出力を確認することができます。

github.com

RStanPyStanAPI 差異については公式ドキュメントに記載がありますがアップデートがされていません。下表にサンプル中で利用したものを簡単にまとめます。

RStan PyStan 概要
stan(...) pystan.stan(...) モデルのコンパイルとサンプリングの実行
stan_model(...) pystan.StanModel(...) モデルのコンパイル
sampling(...) StanModel.sampling(...) サンプリングの実行
extract(...) StanFit4model.extract() サンプリング結果を取得
traceplot(...) StanFit4model.plot(...) サンプリングの経過をプロット

書籍や Rstan のサンプルと合わせてご参照ください。

岩波データサイエンス Vol.1

岩波データサイエンス Vol.1