python - GPflow モデルが tf.optimizers.Adam などの TensorFlow オプティマイザで何も学習していないように見えるのはなぜですか?

Question

私の誘導ポイントはトレーニング可能に設定されていますが、呼び出しても変更されませんopt.minimize()。それはなぜですか、それはどういう意味ですか？モデルが学習していないということですか？tf.optimizers.Adam(lr)とはどう違いgpflow.optimizers.Scipyますか？

以下は、ドキュメントから改変された簡単な分類の例です。このコード例を gpflow の Scipy オプティマイザーで実行すると、トレーニングされた結果が得られ、誘導変数の値が変化し続けます。しかし、Adam オプティマイザを使用すると、直線的な予測しか得られず、ポイントを誘導するための値は同じままです。これは、モデルが Adam オプティマイザーで学習していないことを示しています。

トレーニング前のデータのプロット

Adam でトレーニングした後のデータのプロット

gpflow オプティマイザー Scipy でトレーニングした後のデータのプロット

例のリンクはhttps://gpflow.readthedocs.io/en/develop/notebooks/advanced/multiclass_classification.htmlです。

import numpy as np
import tensorflow as tf


import warnings
warnings.filterwarnings('ignore')  # ignore DeprecationWarnings from tensorflow

import matplotlib.pyplot as plt

import gpflow

from gpflow.utilities import print_summary, set_trainable
from gpflow.ci_utils import ci_niter

from tensorflow2_work.multiclass_classification import plot_posterior_predictions, colors

np.random.seed(0)  # reproducibility

# Number of functions and number of data points
C = 3
N = 100

# RBF kernel lengthscale
lengthscale = 0.1

# Jitter
jitter_eye = np.eye(N) * 1e-6

# Input
X = np.random.rand(N, 1)

kernel_se = gpflow.kernels.SquaredExponential(lengthscale=lengthscale)
K = kernel_se(X) + jitter_eye

# Latents prior sample
f = np.random.multivariate_normal(mean=np.zeros(N), cov=K, size=(C)).T

# Hard max observation
Y = np.argmax(f, 1).reshape(-1,).astype(int)
print(Y.shape)

# One-hot encoding
Y_hot = np.zeros((N, C), dtype=bool)
Y_hot[np.arange(N), Y] = 1

data = (X, Y)

plt.figure(figsize=(12, 6))
order = np.argsort(X.reshape(-1,))
print(order.shape)

for c in range(C):
    plt.plot(X[order], f[order, c], '.', color=colors[c], label=str(c))
    plt.plot(X[order], Y_hot[order, c], '-', color=colors[c])


plt.legend()
plt.xlabel('$X$')
plt.ylabel('Latent (dots) and one-hot labels (lines)')
plt.title('Sample from the joint $p(Y, \mathbf{f})$')
plt.grid()
plt.show()


# sum kernel: Matern32 + White
kernel = gpflow.kernels.Matern32() + gpflow.kernels.White(variance=0.01)

# Robustmax Multiclass Likelihood
invlink = gpflow.likelihoods.RobustMax(C)  # Robustmax inverse link function
likelihood = gpflow.likelihoods.MultiClass(C, invlink=invlink)  # Multiclass likelihood
Z = X[::5].copy()  # inducing inputs
#print(Z)

m = gpflow.models.SVGP(kernel=kernel, likelihood=likelihood,
    inducing_variable=Z, num_latent_gps=C, whiten=True, q_diag=True)

# Only train the variational parameters
set_trainable(m.kernel.kernels[1].variance, True)
set_trainable(m.inducing_variable, True)
print(m.inducing_variable.Z)
print_summary(m)


training_loss = m.training_loss_closure(data) 

opt.minimize(training_loss, m.trainable_variables)
print(m.inducing_variable.Z)
print_summary(m.inducing_variable.Z)


print(m.inducing_variable.Z)

# %%
plot_posterior_predictions(m, X, Y)

python - GPflow モデルが tf.optimizers.Adam などの TensorFlow オプティマイザで何も学習していないように見えるのはなぜですか?

1 に答える 1

Related

Reference