5

私はここで PyMC3 のガウス混合モデルの例に従ってきました: https://github.com/pymc-devs/pymc3/blob/master/pymc3/examples/gaussian_mixture_model.ipynb 人工データセットでうまく動作するようになりました。 ここに画像の説明を入力

実際のデータセットで試してみましたが、賢明な結果を得るのに苦労しています: ここに画像の説明を入力

より適切にフィットさせるために、どのパラメーターを縮小/拡大/変更する必要があるかについてのアイデアはありますか? トレースは安定しているようです。例から調整したモデルのスニペットを次に示します。

model = pm.Model()
with model:
    # cluster sizes
    a = pm.constant(np.array([1., 1., 1.]))
    p = pm.Dirichlet('p', a=a, shape=k)
    # ensure all clusters have some points
    p_min_potential = pm.Potential('p_min_potential', tt.switch(tt.min(p) < .1, -np.inf, 0))


    # cluster centers
    means = pm.Normal('means', mu=[0, 1.5, 3], sd=1, shape=k)
    # break symmetry
    order_means_potential = pm.Potential('order_means_potential',
                                     tt.switch(means[1]-means[0] < 0, -np.inf, 0)
                                     + tt.switch(means[2]-means[1] < 0, -np.inf, 0))

    # measurement error
    sd = pm.Uniform('sd', lower=0, upper=2, shape=k)

    # latent cluster of each observation
    category = pm.Categorical('category', p=p, shape=ndata)

    # likelihood for each observed value
    points = pm.Normal('obs', mu=means[category], sd=sd[category], observed=data)
4

1 に答える 1

3

このトピックに関する優れたブログ記事がここにあります: http://austinrochford.com/posts/2016-02-25-density-estimation-dpm.html

于 2016-03-11T17:23:56.690 に答える