Inbox をダウンロードし、Pig と Hadoop でメールを処理しています。Pig と Wonderdog を使用して、ElasticSearch でこれらのメールのインデックスを作成しました。
現在、受信トレイの各電子メール アドレスの Web ページを作成して、これらのアドレスから送信されたメッセージを表示しています。
私は2つの方法でこれを行うことができます:
1) Pig でメールアドレスごとにグループ化し、MongoDB (または ElasticSearch) に保存します。
2) facets を使用してメール インデックスからこのリストを返すように ElasticSearch にクエリを実行します。
どれが頼りになる答えで、それは何に依存していますか?