確率統計

確率統計

条件付き独立ってどういうことなんだ【確率統計】

今日は、統計や機械学習をやっていると必ず出てくる確率変数の独立性と条件付き独立のお話です。 初学者の方が対象で、内容は言語処理のための機械学習入門 (自然言語処理シリーズ)という本に基づいております。今回は言語処理の話は一切出てきま...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第4章】

まだまだ続くみどり本。 今日は第3章で作ったモデルの中から、一番良いモデルを選ぼうというお話です。 これまで色んなモデルを作ってみたけど、結局どれを選べばよいのか? モデル選択は良い予測をするモデルを選ぶことが重要。観測データへの当てはま...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その3】

今日も元気にみどり本です。第3章を終わらせましょう。 (所々、はてなのtex記法で書いた数式が正しく変換されず、そのまま文字列が表示されてしまっている箇所がありますがご容赦ください…。同じように書いても、正しく表示される時とそうでない時があ...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その2】

みどり本第3章の例題続きです。 前回は例題のデータを分析して、以下のような特徴が得られたのでした。今回はこういった特徴を考慮しながら統計モデルを作っていきます。 種子数: 非負の整数(離散値) 区間 平均と分散がまあまあ近い 体サ...
Python

【Python】緑本こと『データ解析のための統計モデリング入門』を実装していく【第3章その1】

今日も元気にみどり本を進めていきましょう。 前回の第2章の内容を一言でまとめると、「観測データをよく見て対応する真の確率分布を仮定し、そのパラメータを推定する」というお話でした。その流れは第3章も基本的に同じです。 ただし、第2章では平均種...