3

Python と Matplotlib を使用して、いくつかのカテゴリのいずれかに属するデータ ポイントをプロットする散布図を表示しようとしています。カテゴリを凡例を使用して色で表すことにしました。これにより、色が簡単に見えるように十分な大きさのシンボルを使用することと、互いに過度に重なり合わないように十分小さいシンボルを使用することとの間で、難しいトレードオフが生じます。(少なくとも数千点はあります)

ただし、別の問題にも直面しています。カテゴリを numpy 配列のセットに分割し、それを 1 つずつプロットします。これは、最後にプロットされたのでそのポイントが一番上にあるため、最後のカテゴリからさらに多くのポイントがあるように見せる効果があります。すべてのカテゴリを一度に比較的シャッフルしてプロットすると、この問題は発生しませんが、ポイントを色分けできませんでした。ウィンドウのサイズを大きくすると改善されますが、完全に解決するわけではありません。これを軽減する良い方法を知っている人はいますか?データセットを一緒に「シャッフル」したり、単一のプロット内のポイントに異なる色を割り当てたりする方法はありますか? このデータを視覚化するアプローチを変更する必要があるかもしれません。

ここに画像の説明を入力

4

0 に答える 0