AppEngine とアプリケーション用のデータストアを使用しています。ここには、エントリのリストを含む適度に大きな情報のテーブルがあります。
レポートのエントリのリストを要約して、各エントリが何回出現するかを指定したいと思います。たとえば、SQL では通常select distinct
、列に を使用し、すべてのエントリをループして を使用しますselect count(x) where value = valueOfEntry
。
カウント部分は簡単にできますが、明確な問題は「問題」です。これに近いリモートで見つけることができる唯一のソリューションは MapReduce であり、ほとんどのサンプルは Python に基づいています。このブログ エントリは非常に役に立ちますが、reduce 部分よりも古いため、多少古くなっています。次に、ここにビデオと、私が見つけることができたいくつかのリソースがあります。
ただし、別のエンティティに書き込むことができず、削減ステージがない場合、サマリーテーブルを作成する方法を理解するのは本当に難しいですか?
これは些細で簡単に達成できるように思えますが、非常に多くの手間がかかります。すべての摩擦なしに AppEngine にプラグインできるサンプルまたは既存のレポート エンジンはありませんか?
BigQueryを見ましたが、アプリ エンジンからそのストアにデータを移動するのは非常に面倒なようです。データを CSV としてダウンロードしようとしましたが、それに関しても多くの問題が発生しました。長期的には実用的な解決策のようにも思えません。