Probabilistic Programming: Mixture Model

Ref: Baysian Analysis with Python by Osvaldo Martin
?????????????????-
混合モデルMixture Model。異なる分布の混合からデータが発生している場合の解析を単純なモデルを組み合わせて行うのが混合モデル。
それぞれが正規分布するカテゴリカルなデータの組み合わせとして考える。最も単純な例では、コイン投げの問題、つまり表か裏かという2カテゴリーの場合は、ベルヌーイ分布をそれぞれの分布に当てはめて、事前分布には、β分布を用いた。このモデルを発展させて、3カテゴリー(例えば3面サイコロ)のそれぞれの目の出やすさの分布を考える。ベルヌーイ分布をkp個のパターンへと一般化したものがカテゴリカル分布であり、β分布を一般化したものがディリクレ分布である。

まずは3つの正規分布を混合して混合モデルのデータを作成する。

k=3のディリクレ分布については、以下の三角図に描画される。特徴として三角形内に位置する点の3つの座標値の和は、1となることである。

平均と標準偏差が既知の正規分布混合モデルを出力すると、

次に3つの平均、一つの共有標準偏差の正規分布混合モデルを出力する。

統計の要約量は

となる。
この混合モデルを出力すれば、

離散的な潜在変数zについて、周辺化された混合モデルに変更すると、