11

scikit-learn で KMeans アルゴリズムを使用して生成しているプロットがあります。クラスターはさまざまな色に対応しています。ここにプロットがあります、 ここに画像の説明を入力

プロットのクラスター番号に対応するこのプロットの凡例が必要です。理想的には、凡例にクラスターの色を表示し、ラベルにクラスター番号を表示する必要があります。ありがとう。

編集:人々がこれに反対票を投じているので、コードを入れる必要があると思います

from sklearn.cluster import KMeans
km = KMeans(n_clusters=20, init='random')   
km.fit(df)  #df is the dataframe which contains points as coordinates
labels = km.labels_
plt.clf()
fig = plt.figure()
ax = fig.add_subplot(111, axisbg='w', frame_on=True)
fig.set_size_inches(18.5, 10.5)

# Plot the clusters on the map
# m is a basemap object
m.scatter(
         [geom.x for geom in map_points],
         [geom.y for geom in map_points],
         20, marker='o', lw=.25,
         c = labels.astype(float),
         alpha =0.9, antialiased=True,
         zorder=3)
m.fillcontinents(color='#555555')
plt.show()
4

1 に答える 1

11

凡例を色に対応させることができました。重要なのは、Rutger Kassies が述べたように、データの各カテゴリに複数の散布図を使用することでした。

コードは次のとおりです。

import numpy as np
import matplotlib.pyplot as plt

# Setting various plot properties
plt.clf()
fig = plt.figure()
ax = fig.add_subplot(111, axisbg='w', frame_on=True)
fig.set_size_inches(18.5, 10.5)

# Creating a discrete colorbar
colors = plt.cm.rainbow(np.linspace(0, 1, 20))

current_plot_range = 0
previous_plot_range = 0

for i,c in enumerate(colors):
  previous_plot_range += current_plot_range
  current_plot_range = labels[labels==i].size
  m.scatter(
       [geom.x for geom in map_points[      
             previous_plot_range:previous_plot_range+current_plot_range]],
       [geom.y for geom in map_points[
             previous_plot_range:previous_plot_range+current_plot_range]],
       20, lw=.25, marker='o',color = c, label=i, alpha =0.9, antialiased=True, 
       zorder=3)

plt.legend()
m.fillcontinents(color='#555555')

結果は次のようになります。 ここに画像の説明を入力

于 2013-11-14T21:04:20.420 に答える