このようなデータがあります
{super-row-key1 [{ts1 {version-ts1 value, version-ts2 value}}
{ts2 {version-ts1 value}}]
super-row-key2 ...}
これらのキーと値は次のようになります
{"4447c9a6-9912-44d7-a6b5-cef40735f92c:2011-06"
[{1291180500000 {1351709255098 -0.008084167000000001}}
{1291184100000 {1351709255098 -0.004395833}}
{1291185000000 {1351709255098 -0.003075}}]
...}
したがって、ClojureWerks Cassandra カスケード タップがすべての行にわたる操作を既にサポートしているかどうかを調べようとしています。ご覧のとおり、スーパー行キー、スーパー行、およびスーパー列がすべて生成されます (uuid、日付、タイムスタンプなど)。私が見た例とコードでは、列名、列フィールド名、キー列名、およびフィールド マッピングを識別する固定名を事前に指定する必要があると思われます。
MapReduce に対する Cassandra のサポートの Hadoop レベルでは、Cassandra は特定の列ファミリーからのすべてのデータ行のフェッチをサポートしているようです。ドキュメントから:
「Cassandra の行または行フラグメント (つまり、キーのペア + 列の SortedMap) は、各行からフェッチする列を記述する SlicePredicate で指定されているように、ジョブで処理するために Map タスクに入力されます。」
したがって、低レベルでは間違いなく可能であるように見えますが、Cascading レベルで私がやろうとしていることをどのように達成するかは不明です。
これには、既存のタップのバリアントを適応または作成する必要がありますか、それとも既存のタップで何らかの方法で行うことができますか?