0

特定のユースケースで Apache Ignite を評価しています。Ignite 内のキャッシュに 50 GB のデータをロードしようとしています。私はCSV形式のデータを持っています。現在、Java プログラム内のデータを Java Bean の形式で読み取り、Ignite のストリーマー API を使用してキャッシュに Bean を追加しています。別のアプローチ/オプションを探しています。

  1. Ignite には、並列化された方法 (CSV の読み取りとキャッシュへの書き込みの両方) で CSV ファイルのデータを一括ロードするために使用できる、すぐに使用できる機能はありますか?
  2. Java のクライアント プログラムでストリーマー API を使用してデータをロードしているときに、約 600MB のデータが追加されるとストリーマー オブジェクトが閉じられ、クライアント ノードがクラッシュし、続いて他のノードがクラッシュします。500MB のデータを処理している間、データの読み込みは正常に機能しました。各サーバーで 3 つの物理ノード クラスターと 2 つの Ignite ノード インスタンスを使用しています。

どんな提案も役に立ちます。

4

2 に答える 2

0
  1. すぐに使える CSV ストリーマーはありません。
  2. 500MB を超えると、メモリが不足しているように見えます。VisualVM で JVM のメモリ使用率を確認し、不足している場合は -Xmx の値を大きくすることはできますか?
于 2015-07-17T05:36:30.377 に答える