具体的には、論理型とタイムスタンプに関する寄木細工の仕様は、 https://github.com/Parquet/parquet-format/blob/master/LogicalTypes.md 「TIMESTAMP_MILLIS は、論理的な日付と時刻の組み合わせ型に使用されます。注釈を付ける必要があります。 Unix エポック (UTC 1970 年 1 月 1 日の 00:00:00.000) からのミリ秒数を格納する int64。
"
つまり、ここでは、型はミリ秒単位までしか正確ではなく、1970 年から始まると書かれています。
しかし、 https://github.com/apache/hive/blob/branch-0.14/ql/src/java/org/apache/hadoop/hive/ql/io/parquet/convert のhive-parquetコードを見ると /ETypeConverter.java#L142 https://github.com/apache/hive/blob/branch-0.14/ql/src/java/org/apache/hadoop/hive/ql/io/parquet/timestamp/NanoTime.java# L54 寄木細工のタイムスタンプのハイブのエンコーディングは、ナノ秒のポイントまで正確で、「Monday, January 1, 4713」(jodd.datetime.JDateTime で定義) から始まる別の仕様のようです。
Hive の parquet タイムスタンプ ストレージは、上記の仕様とはまったく異なりますか?
デートのサポートは?https://issues.apache.org/jira/browse/HIVE-8119 上記のドキュメントで指定されている「int32」とは異なるオンディスク バイナリ エンコーディングを使用する予定ですか?
ありがとう