テーブルのビューを次のように作成しました。
CREATE VIEW anonymous_table
AS SELECT id, value FROM sensitive_table
ビューをid
クエリする人が実際のid
. Hiveでこれを行う良い方法は何ですか?
いくつかのオプション:
ビューに ID を含めないでください。
CREATE VIEW something AS SELECT "HIDDEN ID"、sensitive_table の値。
レコードごとに個別のキーを使用できるようにする必要がある場合は、UDF を記述して、好きな変換を行うことができます。
JAR mycode.jar を追加します。「com.example.MyUDF」として CREATE TEMPORARY FUNCTION ハッシュ; SELECT hash(id)、sensitive_table の値として何かを作成します。
おまけ: ユーザーはとにかく機密性の高いテーブルを見ることができるので、ハイブに到着する前に ID をハッシュできますか? これはおそらく正直なところ最良の選択肢です。
いずれにせよ、ID を処理している場合、参加や集計などのために ID に依存する必要がある場合は、安定したハッシュ関数が必要になります。