これによれば:
選択度は 0 から 1 の間の値であり、テーブルにフィルターを適用した後に返される行の割合です。たとえば、テーブルに 10,000 行があり、クエリが 2601 行を返す場合、選択性は 2601/10000 または .26 または 26 パーセントになります。選択性により、ユーザー (またはオプティマイザー) は、実行計画で最適なデータ アクセス方法を決定できます。
いくつか明確にする必要があります。わかりました、そのテーブルには 10000 行があり、クエリによって返されるのは 2601 行だけです。しかし、そのクエリ ブロックに 3 つの結合されたテーブルが含まれている場合、または where 句にサブクエリが含まれている場合はどうなるでしょうか。FROM 句には 3 つのテーブルがあり、4 番目のテーブルは where 句のサブクエリの一部です。この選択性はどのように計算されるのでしょうか?
選択性 = 条件を満たす行の数 (どのテーブルから?) / 行の総数 (4 つのテーブルすべてから?)
カーディナリティについても同じ質問です (カーディナリティ = 選択性 * 行の総数)。
これに関する多くの記事を見つけましたが、それぞれの記事では、単一のテーブルまたは単一の where 句の条件に基づいて、単純な select ステートメントを使用してこれらの概念を例示しています。
もう少し複雑なクエリ (「hr」スキーマ、またはその他のトレーニング目的のスキーマ)、つまり FROM 句のサブクエリ、または WHERE 句などの場合に、これらの測定値がどのように計算されるかの例を教えてください。
ありがとうございました。
EDIT:Estimator(Cost-Based Optimizer)によって計算された選択性の尺度について明確にする必要があります。 http://gerardnico.com/wiki/database/oracle/selectivity たとえば、等値述語 (last_name = 'Smith') の場合、選択度は last_name の個別の値の数 n の逆数に設定されます。 n 個の異なる値のうちの 1 つをすべて含む行。
「異なる値の数 n の逆数」ということを理解する方法がわかりません。
employees テーブルに 107 行があり、クエリコードが [すべて選択] [表示/非表示] であると仮定します。
select * from employees where last_name = 'Smith'
2 行を返します。選択度は 2/107 = 0.01? したがって、述語を満たす行数/行の総数です。したがって、この方程式には「明確な」ものは含まれていません。
ステートメントのこの選択性とは別に、列の選択性もあり、これは NDV (その列の個別の値の数 - dba_tab_col_statistics からクエリ可能) / 行の総数 ( http://www.runningoracle .com/product_info.php?products_id=233 )。したがって、NDV が 103 の場合、last_name 列の選択性は 103/107 = 0.96 です。
これは私が理解したものです..これは正しいですか?私が間違っている場合は、私を修正してください。
ありがとうございました。