doc2vec を使用して、フォロワーの上位 100 件のツイートをベクトル表現 (v1.....v100 など) に変換しています。その後、ベクトル表現を使用して K-Means クラスターを実行しています。
model = Doc2Vec(documents=t, size=100, alpha=.035, window=10, workers=4, min_count=2)
クラスター 0 がいくつかの値 (v10、v12、v23 など) によって支配されていることがわかります。私の質問は、これらの v10、v12 などは何を表しているのかということです。これらの特定の列がドキュメントの特定のキーワードをクラスター化していると推測できますか。