GLMのベイズモデル化と事後分布の確定:より詳細な理解へ

ベイズモデル化について、理解できた部分と、依然、全体的には「もやー」とした状態。もう少し、丁寧に分析してみよう。
ーーーーーーーーーーーーーーーーーーーーーーーーーー
データ解析のための統計モデリング入門:第9章「GLMのベイズモデル化と事後分布の確定」について、より詳細に分析してみる。
ーーーーーーーーーーーーーーーーーーーーーーーーーー
9.1 例題:趣旨数のポアソン回帰(個体差なし)

xが体サイズで、yが種子数。観測データを図にしてみる。


サイズがxi=5の場合、種子数yiが10-12個がプロットされている。xi=5がピークのように見えるが、全体としてはばらついているように見える。

クラス関数class()で、変数dのクラスを調べるとdata.frameクラスが返る。

lenght()関数をdに当てはめると、2と返す。要するにxとyとで2ということか。

summary()関数でdの標本平均や最小値、最大値、四分位数を返す。

体サイズxの最小値は3で最大値は7、平均値が5、メディアンが5
種子数yの最小値は3.00、最大値は12.00、平均値は7.30、メディアン7.00

度数分布を得るためtable()関数で調べてみると、

種子数のヒストグラムを出すと、

xとyの分散を調べておく

xとyの標準偏差

ポアソン回帰の統計モデルとして、平均λiを説明変数xiの関数として、ある個体iの平均種子数λiは

線形予測子>
λi = exp(β1 + β2xi)
β2は傾き、β1は切片
対数リンク関数>
logλi = β1 + β2xi

ポアソン回帰でβの最尤推定値を求めると、

9.4 ベイズ統計モデルの事後分布の推定
9.4.1 ベイズ統計モデルのコーディング
βの事前分布=平べったい正規分布N(0,100)

dnorm(mean, tau) meanは平均、tauは分散の逆数, 標準偏差1/√tau
tau = 1/σ2=1.0E-4, σ^2 = 1000, σ= 100

BUGSモデル:ポアソン分布

R2WBwrapper.Rファイルで定義されているto.list()関数とto.mcmc()関数を用いて、post.bugsオブジェクトをそれぞれto.listクラスとmcmcクラスのオブジェクトに変換する。

post.bugs以後の処理
post.bugsのクラスを調べると

bugsと返される。

R2WBrapper.Rの中に記載されているように、

post.listの中身には、3回回したMCMCのデータが入っている。

post.mcmcには、どうやら生のmcmcデータ 500×3=1500 含まれているようだ。

1ループ目のMCMC結果だけ取り出してpost.list_1に挿入する。

さらに1ループ目のパラメータβ1だけをpost.list_1[,1]で覗いてみる。500個のデータが含まれている。

post.mcmcについても、1列目のβ1だけをのぞいてみると、1500個のデータ

パラメータの事後分布からのサンプル


9.5.1 事後分布の統計量