簡単に言えば、プロセスとの間でデータを読み書きする Java プロセスがあります。データを取得して処理し、Java がデータベースに書き込むことができるように Java に戻す必要がある C++ プログラムがあります。
Java プログラムは Hadoop からデータをプルするため、Hadoop プロセスが開始されるとデータが殺到しますが、実際の処理 (C++ プログラムによって行われる) ではすべてのデータを一度に処理することはできません。そのため、フローを制御する方法も必要です。また、問題を複雑にするために (ただし、私の作業は単純化します)、私は Java の作業を行い、友人は C++ の作業を行い、プログラムをできるだけ独立させようとしています。
それが問題です。Google プロトコル バッファを見つけました。プログラム間でデータを渡すのはかなりクールに思えますが、データを保存する Java プログラムがどのように C++ プログラムの処理をトリガーできるか、そして C++ プログラムが結果を保存するときに Java プログラムがどのようにトリガーされるかはわかりません。結果を保存します (これは 1 つまたはいくつかのレコード用ですが、数十億のレコードを処理する予定です)。
この問題への最善のアプローチは何ですか? これを行う簡単な方法はありますか?