csvログファイルがあります。この文を使用してHiveにロードした後:
CREATE EXTERNAL TABLE iprange(id STRING, ip STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\,' STORED AS TEXTFILE LOCATION '/user/hadoop/expandediprange/';
次のような単純なクエリを実行したいと思います。
select * from iprange where ip="0.0.0.2";
しかし、私は空の結果を取得します。
HDFSでHiveを実行していますが、HBaseを使用する必要がありますか?私の結論は、それはテーブルのサイズと関係があるということです。ログファイルは160MBで、Hiveで生成されたテーブルには800万行があります。自分で小さなファイルを作成してHiveにロードしようとすると、機能します。
何が悪いのか考えていますか?
編集:小さなインスタンスを使用してAmazonElasticMapReduceで実行されていると言うのを忘れました。