Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その1】

今日も元気にみどり本を進めていきましょう。 前回の第2章の内容を一言でまとめると、「観測データをよく見て対応する真の確率分布を仮定し、そのパラメータを推定する」というお話でした。その流れは第3章も基本的に同じです。 ただし、第2章では平均種...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第2章その2】

間隔が空いてしまいましたが、緑本の第2章の続きです。 ちなみに、手元では最終章以外は既に実装まで終わっています(最後の最後に出てくる条件付き自己回帰の話が理解できずに詰んでます…)。 植物の種子数の統計モデリングということで、前回は手元にあ...
確率統計

似ているけど異なる「最尤推定量」と「最尤推定値」の違い【確率統計】

ゴールデンウイークも残り僅かですね。 月曜日から始めた緑本ですが、休みを捧げた甲斐もあって、8章のMCMCとベイズ化のところまでは読み終え、Pythonでの実装まで試せました。 実装をブログに上げたいのですが、Jupyterで書いた数式をは...
Python

【Pandas】データフレームからクラスごとに色分けされた散布図を2行で作成する方法

前提 以下のようなPandasのデータフレームがあったとします。 # pandasをimportしていること前提 # dfはpandas.DataFrame(100 rows × 3 columns) df.head() y x f 0 6...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第2章その1】

今日は緑本第2章を読んで実装しました。 以下のコードは本に載っているものと異なります。オリジナルのコードはRなのですが、ここでは私が慣れているPythonで進めていきます。 色々言葉でまとめてある部分は、私のメモなので、オリジナルの文章と異...