2

非常に単純な MR ジョブを実行するために、Twitter ストリーミング API から取得した大量のツイートを COSMOS にダンプするための最良の方法は何だろうかと考えています。

コレクション ドキュメントを 1 行に 1 つずつ、おそらく CSV に変換してから、それらを COSMOS に scp することを考えていました。しかし、そこで MR ジョブを一度実行するために HIVE が必要なのか、それともより手動でジョブを実行できるのかはわかりません。これには Python を使用することを考えていましたが、Java を使用する必要はありません。

ありがとう

4

1 に答える 1