を使用して大規模なウェブログ処理プロジェクトに取り組んでapache Cassandra
いますが、 columnfamily に行が多すぎるのではないかと思います。これによりクエリが遅くなりますか??
私のデータでは、1日あたり約1000億行のログがあります
それらを多くの列ファミリーに分割すると(20120627のような日パターンとして)、より理想的です???
このデータをモデル化するための提案をしてくれる人はいますか??
私はそのような列ファミリーのみを作成するつもりです:
CREATE TABLE data (
KEY text PRIMARY KEY
) WITH
comment='log' AND
comparator=text
タイムスタンプのチャンクでデータを処理したい (ex 処理: 10:20 --> 10:30 データ)