ファクト テーブルとそのディメンション テーブルをまとめて含む大きな TSV データ ファイルがあります。Spark を使用して、その単一のファイルを異なる「テーブル」に分割/パーティション化し、結合を実行してそれらを正規化することが可能かどうか疑問に思っていますか?
私を正しい方向に向ける助けは素晴らしいでしょう。
ファクト テーブルとそのディメンション テーブルをまとめて含む大きな TSV データ ファイルがあります。Spark を使用して、その単一のファイルを異なる「テーブル」に分割/パーティション化し、結合を実行してそれらを正規化することが可能かどうか疑問に思っていますか?
私を正しい方向に向ける助けは素晴らしいでしょう。