27

デコレーターを使用して「指数確率変数の対数」の確率オブジェクトを定義することに失敗した後、 pymc.stochastic_from_dist. 私が実装しようとしているモデルは、ここで入手できます (最初のモデル): ここに画像の説明を入力

MCMC Metropolis を使用し、正規分布を提案として使用してログ (アルファ) をサンプリングしようとすると (次の図でサンプリング方法として示されているように)、次のエラーが発生します。

  File "/Library/Python/2.7/site-packages/pymc/distributions.py", line 980, in rdirichlet
    return (gammas[0]/gammas[0].sum())[:-1]

FloatingPointError: invalid value encountered in divide

サンプリングでエラーが発生しない場合もありますが、サンプリング ヒストグラムはこのホワイト ペーパーのものと一致しています。私の階層モデルは次のとおりです。

"""
A Hierarchical Bayesian Model for Bags of Marbles

logalpha ~ logarithm of an exponential distribution with parameter lambd
beta ~ Dirichlet([black and white ball proportions]:vector of 1's)
theta ~ Dirichlet(alpha*beta(vector))

"""

import numpy as np
import pymc
from scipy.stats import expon
lambd=1.
__all__=['alpha','beta','theta','logalpha']
#------------------------------------------------------------
# Set up pyMC model: logExponential
# 1 parameter: (alpha)

def logExp_like(x,explambda):
    """log-likelihood for logExponential"""
    return -lambd*np.exp(x)+x
def rlogexp(explambda, size=None):
    """random variable from logExponential"""
    sample=np.random.exponential(explambda,size)
    logSample=np.log(sample)
    return logSample
logExponential=pymc.stochastic_from_dist('logExponential',logp=logExp_like,
                                          random=rlogexp,
                                          dtype=np.float,
                                          mv=False)
#------------------------------------------------------------
#Defining model parameteres alpha and beta.
beta=pymc.Dirichlet('beta',theta=[1,1])
logalpha=logExponential('logalpha',lambd)

@pymc.deterministic(plot=False)
def multipar(a=logalpha,b=beta):
    out=np.empty(2)
    out[0]=(np.exp(a)*b)
    out[1]=(np.exp(a)*(1-b))
    return out
theta=pymc.Dirichlet('theta',theta=multipar)

私のテストサンプリングコードは次のとおりです。

from pymc import Metropolis
from pymc import MCMC
from matplotlib import pyplot as plt
import HBM
import numpy as np
import pymc
import scipy
M=MCMC(HBM)
M.use_step_method(Metropolis,HBM.logalpha, proposal_sd=1.,proposal_distribution='Normal')
M.sample(iter=1000,burn=200)

distributions.py の 978 行で gamma distribution に渡された theta の値を確認すると、値がゼロではなく小さいことがわかります。この浮動小数点エラーを防ぐ方法がわかりませんか?

4

3 に答える 3

0

小さい数値を取得した場合は、単純に float には小さすぎる可能性があります。これは通常、対数が回避するためにあるものでもあります。を使用するとどうなりますdtype=np.float64か?

于 2013-10-28T17:20:44.810 に答える
0

質問の最後で提案したように、問題は浮動小数点で 0 にキャストされた数値が小さすぎることです。特定のしきい値に小さな値への明示的なキャストを追加する「where」条件。

于 2020-03-30T22:50:06.640 に答える