ORCファイルは初めてです。多くのブログを調べましたが、明確な理解が得られませんでした。以下の質問を助けて明確にしてください。
ORC ファイルからスキーマを取得できますか? Avro では、スキーマをフェッチできることを知っています。
実際にスキーマの進化をどのように提供しますか? 追加できる列がほとんどないことはわかっています。しかし、それを行う方法。私が知っている唯一の orc ファイルの作成は、データを orc 形式で保存するハイブテーブルにデータをロードすることです。
ORC ファイルのインデックスはどのように機能しますか? 私が知っていることは、すべてのストライプ インデックスが維持されるということです。ただし、ファイルはソートされていないため、ストライプのリストでデータを検索するのに役立ちます。データの検索中にストライプをスキップするのにどのように役立ちますか?
列ごとにインデックスが維持されます。はいの場合、より多くのメモリを消費することはありませんか?
列形式の ORC ファイルが、各列の値が一緒に格納されるハイブ テーブルにどのように収まるか。一方、ハイブテーブルはレコードごとにフェッチするように作られています。両方がどのように適合しますか?