Python

Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第4章】

まだまだ続くみどり本。 今日は第3章で作ったモデルの中から、一番良いモデルを選ぼうというお話です。 これまで色んなモデルを作ってみたけど、結局どれを選べばよいのか? モデル選択は良い予測をするモデルを選ぶことが重要。観測データへの当てはまり...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その3】

今日も元気にみどり本です。第3章を終わらせましょう。 (所々、はてなのtex記法で書いた数式が正しく変換されず、そのまま文字列が表示されてしまっている箇所がありますがご容赦ください…。同じように書いても、正しく表示される時とそうでない時があ...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その2】

みどり本第3章の例題続きです。 前回は例題のデータを分析して、以下のような特徴が得られたのでした。今回はこういった特徴を考慮しながら統計モデルを作っていきます。 種子数: 非負の整数(離散値) 区間 平均と分散がまあまあ近い 体サイズ: 正...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その1】

今日も元気にみどり本を進めていきましょう。 前回の第2章の内容を一言でまとめると、「観測データをよく見て対応する真の確率分布を仮定し、そのパラメータを推定する」というお話でした。その流れは第3章も基本的に同じです。 ただし、第2章では平均種...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第2章その2】

間隔が空いてしまいましたが、緑本の第2章の続きです。 ちなみに、手元では最終章以外は既に実装まで終わっています(最後の最後に出てくる条件付き自己回帰の話が理解できずに詰んでます…)。 植物の種子数の統計モデリングということで、前回は手元にあ...