6

タイムスタンプを保持するデータベースがあるとします。タイムスタンプ属性ごとに、信頼区間を示す精度属性を追加する場合があります。そのため、保存される情報は、たとえば「2012年7月1日12:13、+/-3か月」になります。

しかし、一般的に、記録の正確性/信頼性はそれほど単純ではありません。系図データベースは、ある人が別の人の父親である可能性があるという事実を記録する必要がある場合があります。

では、さまざまなレベルの精度/信頼性で情報を保存するための一般的な原則やベストプラクティスはありますか?

4

1 に答える 1

4

あなたの父親の例では簡単です。誰かが他の誰かの父親であるということを 100% 以上確信することは不可能です。一般に、100% 以上の自信を持つことは不可能です。これは、すべてのデータ属性のパーセンテージ信頼レベルを単純に保存できることを意味します。

ただし、信頼水準をパーセンテージで保存したくない場合もあります。それはデータ属性自体とデータの意味に依存します。

たとえば、特定の文字列が別の文字列と比較してどの程度「正確」であるかを保存する場合は、代わりにレーベンシュタイン距離を保存することをお勧めします。タイムスタンプの例では、個人的に最小値と最大値を保存しますが、加算または減算する月数を保存することもできます。どちらも、データベースからの選択をすばやく計算できます。

おそらく不明確ですが、私が書き込もうとしているのは、あなたの質問に対する答えはデータベースに依存するのではなく、データベース内のデータとユーザー、ビジネスなどのニーズに依存するということです。それはデータに依存するため、個々の属性または列には個別のソリューションが必要です。「一般的な」解決策はあり得ません。

于 2012-07-01T11:48:24.313 に答える