Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その2】

みどり本第3章の例題続きです。 前回は例題のデータを分析して、以下のような特徴が得られたのでした。今回はこういった特徴を考慮しながら統計モデルを作っていきます。 種子数: 非負の整数(離散値) 区間 平均と分散がまあまあ近い 体サイズ: 正...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その1】

今日も元気にみどり本を進めていきましょう。 前回の第2章の内容を一言でまとめると、「観測データをよく見て対応する真の確率分布を仮定し、そのパラメータを推定する」というお話でした。その流れは第3章も基本的に同じです。 ただし、第2章では平均種...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第2章その2】

間隔が空いてしまいましたが、緑本の第2章の続きです。 ちなみに、手元では最終章以外は既に実装まで終わっています(最後の最後に出てくる条件付き自己回帰の話が理解できずに詰んでます…)。 植物の種子数の統計モデリングということで、前回は手元にあ...
確率統計

似ているけど異なる「最尤推定量」と「最尤推定値」の違い【確率統計】

ゴールデンウイークも残り僅かですね。 月曜日から始めた緑本ですが、休みを捧げた甲斐もあって、8章のMCMCとベイズ化のところまでは読み終え、Pythonでの実装まで試せました。 実装をブログに上げたいのですが、Jupyterで書いた数式をは...
Python

【Pandas】データフレームからクラスごとに色分けされた散布図を2行で作成する方法

前提 以下のようなPandasのデータフレームがあったとします。 # pandasをimportしていること前提 # dfはpandas.DataFrame(100 rows × 3 columns) df.head() y x f 0 6...