R で多くのポイントの散布図を作成しているときに (ggplot()
たとえば、使用して)、他のポイントの背後にあり、まったく表示されない多くのポイントが存在する可能性があります。たとえば、以下のプロットを参照してください。
これは数十万のポイントの散布図ですが、それらのほとんどは他のポイントよりも後ろにあります。問題は、出力をベクター ファイル (PDF ファイルなど) にキャストする場合です。見えないポイントによってファイル サイズが非常に大きくなり、ファイルの表示中にメモリと CPU の使用量が増加します。
簡単な解決策は、出力をビットマップ画像 (TIFF や PNG など) にキャストすることですが、ベクターの品質が失われ、サイズがさらに大きくなる可能性があります。オンラインの PDF コンプレッサーをいくつか試しましたが、元のファイルと同じサイズになりました。
良い解決策はありますか?たとえば、おそらくプロットの生成中またはその後に PDF ファイルを編集して、表示されていないポイントをフィルタリングする方法はありますか?