私は現在、画像データセット(250,000枚の画像、つまり特徴ベクトルと同じくらい、すべてが132の特徴で構成されている)に取り組んでおり、sklearnが提供するKMeans関数を使用しようとしています。
Mac OS X 10.10、Python 2.7、および sklearn 0.15.2 で実行しましたが、しばらくすると次のような結果しか得られませんでした。
殺された: 9
これらのコマンド ラインを実行するとエラーが発生します:
nb_cls = int(raw_input("Number of clusters chosen :"))
clusterer = sklearn.cluster.KMeans(n_clusters=nb_cls)
clusters_labels = clusterer.fit_predict(X)
silhouette = sklearn.metrics.silhouette_score(X, clusters_labels)
print "n clusters =", nb_cls, "/ silhouette_score =", silhouette
シルエット スコアを計算しない限り、コードは強制終了されないことに注意してください。
より小さいデータセット (± 2,500 画像) の場合、同じアルゴリズムが効率的であり、そのような Python エラーはありません。
この Killed 9 エラーを回避するにはどうすればよいですか? この計算は、私のラップトップには野心的すぎますか?