Hive でテーブルを定義していて、日付に基づいてパーティション分割する予定で、日付の形式が YYYYMMDD の場合、int または string のどちらのタイプを選択する必要がありますか?
それが単なるフィールドであり、テーブルに提供しているファイルの場合、データに侵入する可能性のある不正な形式のエントリを検索して特定できるようにするためであっても、文字列を使用していることがわかります。しかし、ロード プロセスの一部としてパーティションを指定するので、常に正しい形式の値が得られることがわかっています。
句で使用される場合Where
、パーティション フィールドは通常、等号または以下/以上のロジックになります。