私は現在、推奨アプリケーションに取り組んでおり、map/reduce ジョブに Hadoop と pig で cassandra を使用しています。列名のプロパティを利用するために、私たちのチームは値のない列を使用してデータを保存し、列名を集計することにしました。たとえば、特定のコンテンツのすべてのヒットは単一行の列ファミリーに保存され、各列は次の構造を使用したコンテンツ:
rowkey = 'single_row' {
id_content:hit_date, -
.
.
.
}
このスキーマでは、スキニーではなく幅の広い行が取得されます。問題は、このスキーマを使用して cassandra にデータを保存するために、Pig でデータを操作する必要があるかどうかです。