3

データマイニングのウェブサイトに興味があります。DB内のデータは非常に機密性が高くなります。

DB内のデータを暗号化する方法を見つけ、自分でもデータを読み取れないことをクライアントに証明したいと思います。

問題は、サーバー側で夜間に関係を「バッチ処理」できることであり、ソフトウェアはデータをクリアに読み取ることができなければなりません。

アイデアはありますか?

4

4 に答える 4

1

You haven't described what you need done in terms of the reports. There are lots of approaches for doing computation on encrypted data. I suggest you start with these two approaches.

  1. Check out the book Translucent Databases 2nd Edition by Peter Wayner. The quote Wayner, " The book is still designed to help the world build databases that answer useful questions without keeping any useful information around. The examples show how most databases don't need to be filled with the world's secrets and personal information. If the client uses the right amount of encryption, the databases don't need to be dangerous one-stop shopping for the identity thieves and others who with malice aforethought."

  2. If you have a PhD in cryptography and you have a few billion cycles to burn, you should read up on Homomorphic Encryption.

于 2012-02-28T04:30:37.393 に答える
0

データを復号化できない方法はありませんがソフトウェア制御できる限り、ソフトウェアは復号化できます。

ソフトウェアがデータを復号化できるように、どこかにキーが必要です。ソフトウェアがアクセス可能なコンピューターで実行されている場合は、キーにアクセスできます。これを回避する方法はありません。

クライアントは、データに対して悪意のあることを何もしないようにあなたを信頼するか、自分で(または別のサービスで)処理を行う必要があります。

準同型暗号化を使用する方法はいくつかあるかもしれませんが(つまり、関数のenc(f1(a,b)) = f2(enc(a), enc(b))ペアがある場合)、これは非常に限られた操作、これをサポートするために特別に作成された暗号化スキームに対してのみ機能し、データがマイニング」が必要です。f1f2

于 2011-11-27T23:25:05.220 に答える
0

@ vy32 が述べたように、準同型暗号化はこれを行うための理論的な方法を提供しますが、今日では実用的ではありません。

暗号化されたデータではなく、匿名化されたデータをリクエストするのはどうですか?

たとえば、顧客を区別するために顧客名や国民 ID は必要ありません。匿名の ID で十分です。別の例: 一部のデータ値はハッシュ化できるため、さまざまなエンティティを区別できますが、それらが何であるかはわかりません。数値は順序として指定できるため、正確な量ではなく、すべてのペアについてどちらが大きいかを知ることができます。ほとんどのアプリケーションの個人名など、重要でないフィールドは単純に省略できます。

匿名化に専念する一連の作業と、匿名化されたデータセットの非匿名化に専念する別の作業がありますが、いくつかの単純な変換で長い道のりを歩むことができます.

于 2014-11-12T15:36:26.780 に答える
0

最も基本的なデータ暗号化である RSA を検討する必要があります。暗号化には 2 つの鍵があり、1 つは公開鍵、もう 1 つは秘密鍵です。それがどのように機能するかをお知らせください。

于 2011-11-04T17:21:11.383 に答える