次のディストリビューションから論文用のこのデータ セットを生成するのに問題があります。
私の試みは、より独立しているように見えるこのデータセットをもたらします。どこが間違っているのか分からないようです。誰か助けてくれませんか?
コードは次のとおりです。
# Non-linear dependence without correlation
import numpy as np
import matplotlib.pyplot as plt
x = np.random.uniform(-0.5, 0.5, 500)
def y_samples(x):
y = []
for i in x:
if np.abs(i) <= 1/6:
y.append(np.random.normal(0, 1/9))
else:
y.append(0.5 * np.random.normal(1, 1/9) + 0.5 * np.random.normal(-1, 1/9))
return y
y = y_samples(x)
plt.scatter(x, y)
plt.xlabel('x')
plt.ylabel('y')
plt.show()
ありがとう!