データはHDFSのdata/2011/01/13/0100 / fileにあります。各ファイルには、名前、IP、URLなどのタブで区切られたデータが含まれています。
Hiveでテーブルを作成し、hdfsからデータをインポートしたいのですが、テーブルにはtime、name、ip、urlが含まれている必要があります。
Hiveを使用してこれらをインポートするにはどうすればよいですか?r時刻もインポートできるように、データは他の形式にする必要がありますか?
ファイルをロードするテーブルを作成してから、LOAD DATA コマンドを使用してファイルを Hive テーブルにロードする必要があります。使用する正確な構文については、 Hive のドキュメントを参照してください。
よろしく、ジェフ
これを行うには、パーティションを使用する必要があります。詳細については、次を参照してください。