12

ここで、SQL 担当者向けの頭の体操をします。これらの関数の最初の関数が正常に実行され、2 番目の関数の実行速度が非常に遅い理由を誰か思いつきますか?

機能 A - 通常は 5 ミリ秒以内に終了します

CREATE FUNCTION dbo.GoodFunction
(
    @IDs UniqueIntTable READONLY
)
RETURNS TABLE
AS RETURN
    SELECT p.ID, p.Node, p.Name, p.Level
    FROM
    (
        SELECT DISTINCT a.Ancestor AS Node
        FROM Hierarchy h
        CROSS APPLY dbo.GetAncestors(h.Node.GetAncestor(1)) a
        WHERE h.ID IN (SELECT Value FROM @IDs)
    ) np
    INNER JOIN Hierarchy p
    ON p.Node = np.Node

機能 B - 実行速度が非常に遅い - 5 分後にあきらめた

CREATE FUNCTION dbo.BadFunction
(
    @IDs UniqueIntTable READONLY
)
RETURNS TABLE
AS RETURN
    WITH Ancestors_CTE AS
    (
        SELECT DISTINCT a.Ancestor AS Node
        FROM Hierarchy c
        CROSS APPLY dbo.GetAncestors(c.Node.GetAncestor(1)) a
        WHERE c.ID IN (SELECT Value FROM @IDs)
    )
    SELECT p.ID, p.Node, p.Name, p.Level
    FROM Ancestors_CTE ac
    INNER JOIN Hierarchy p
    ON p.Node = ac.Node

この関数が何をするかを以下で説明しますが、その前に、私が知る限り、これら 2 つの関数はまったく同じであるため、重要ではないと考えていることを指摘したいと思います! 唯一の違いは、一方が CTE を使用し、他方がサブクエリを使用することです。A のサブクエリの内容と B の CTE は同一です

誰かがこれを問題だと判断した場合: この関数の目的は、階層内の任意の数の場所のすべての可能な祖先 (親、祖父母など) を選択することです。Node列は でありhierarchyid、パスをたどるだけのdbo.GetAncestorsCLR 関数であり、データ アクセスは行いません。

UniqueIntTableこれは、1 つの列を持つユーザー定義のテーブル タイプValue int NOT NULL PRIMARY KEYです。ここでインデックスを作成する必要があるものはすべてインデックスが作成されます。関数 A の実行計画は、関数 B の場合と同様に、基本的には 2 つのインデックス シークと 1 つのハッシュ マッチだけです。

この奇妙な問題にはさらに奇妙な側面があります。

  • 関数 B を使用した単純なクエリの推定実行計画を取得することさえできません。パフォーマンスの問題は、この単純に見える関数のコンパイルに関係しているようです。

  • 関数 B から「本体」を取り出してインライン クエリに貼り付けると、関数 A と同じパフォーマンスで正常に実行されます。そのため、UDF 内のCTE に問題があるように見えるか、逆に、 CTE を使用する UDF。

  • B を実行しようとすると、テスト マシンの 1 つのコアの CPU 使用率が 100% にまで跳ね上がります。I/O はそれほど多くないようです。

SQL Server のバグとして肩をすくめてバージョン A を使用したいのですが、ルール 1 ( 「SELECT Ain't Broken」 ) を常に念頭に置いており、関数 A からの良い結果が得られることを懸念しています。 Bが別のサーバーで行うのと同じように「失敗」するという、どういうわけかローカライズされたまぐれです。

何か案は?


更新- 再現する完全な自己完結型スクリプトを含めています。

GetAncestor 関数

[SqlFunction(FillRowMethodName = "FillAncestor", 
    TableDefinition = "Ancestor hierarchyid", IsDeterministic = true,
    IsPrecise = true, DataAccess = DataAccessKind.None)]
public static IEnumerable GetAncestors(SqlHierarchyId h)
{
    while (!h.IsNull)
    {
        yield return h;
        h = h.GetAncestor(1);
    }
}

スキーマの作成

BEGIN TRAN

CREATE TABLE Hierarchy
(
    ID int NOT NULL IDENTITY(1, 1)
        CONSTRAINT PK_Hierarchy PRIMARY KEY CLUSTERED,
    Node hierarchyid NOT NULL,
    [Level] as Node.GetLevel(),
    Name varchar(50) NOT NULL
)

CREATE INDEX IX_Hierarchy_Node
ON Hierarchy (Node)
INCLUDE (Name)

CREATE INDEX IX_Hierarchy_NodeBF
ON Hierarchy ([Level], Node)

GO

INSERT Hierarchy (Node, Name)
    SELECT CAST('/1/' AS hierarchyid), 'Alice' UNION ALL
    SELECT CAST('/1/1/' AS hierarchyid), 'Bob' UNION ALL
    SELECT CAST('/1/1/1/' AS hierarchyid), 'Charles' UNION ALL
    SELECT CAST('/1/1/2/' AS hierarchyid), 'Dave' UNION ALL
    SELECT CAST('/1/1/3/' AS hierarchyid), 'Ellen' UNION ALL
    SELECT CAST('/1/2/' AS hierarchyid), 'Fred' UNION ALL
    SELECT CAST('/1/3/' AS hierarchyid), 'Graham' UNION ALL
    SELECT CAST('/1/3/1/' AS hierarchyid), 'Harold' UNION ALL
    SELECT CAST('/1/3/2/' AS hierarchyid), 'Isabelle' UNION ALL
    SELECT CAST('/1/4/' AS hierarchyid), 'John' UNION ALL
    SELECT CAST('/2/' AS hierarchyid), 'Karen' UNION ALL
    SELECT CAST('/2/1/' AS hierarchyid), 'Liam' UNION ALL
    SELECT CAST('/2/2/' AS hierarchyid), 'Mary' UNION ALL
    SELECT CAST('/2/2/1/' AS hierarchyid), 'Nigel' UNION ALL
    SELECT CAST('/2/2/2/' AS hierarchyid), 'Oliver' UNION ALL
    SELECT CAST('/2/3/' AS hierarchyid), 'Peter' UNION ALL
    SELECT CAST('/2/3/1/' AS hierarchyid), 'Quinn'

GO

CREATE TYPE UniqueIntTable AS TABLE 
(
    Value int NOT NULL,
    PRIMARY KEY (Value)
)

GO

COMMIT

GO

上記のコード/スクリプトを使用して、CLR 関数/DB スキーマを作成できます。元のスクリプトと同じものを使用しGoodFunctionます。BadFunction

4

5 に答える 5

10

ハハ、これを試してください:

IF OBJECT_ID('_HappyFunction' ) IS NOT NULL DROP FUNCTION _HappyFunction
IF OBJECT_ID('_SadFunction'   ) IS NOT NULL DROP FUNCTION _SadFunction
IF TYPE_ID  ('_UniqueIntTable') IS NOT NULL DROP TYPE _UniqueIntTable
GO

CREATE TYPE _UniqueIntTable AS TABLE (Value int NOT NULL PRIMARY KEY)
GO

CREATE FUNCTION _HappyFunction (@IDs _UniqueIntTable READONLY)
RETURNS TABLE AS RETURN
  SELECT Value FROM @IDs
GO

CREATE FUNCTION _SadFunction (@IDs _UniqueIntTable READONLY)
RETURNS TABLE AS RETURN 
  WITH CTE AS (SELECT Value FROM @IDs)
  SELECT Value FROM CTE
GO

-- this will return an empty record set
DECLARE @IDs _UniqueIntTable 
SELECT * FROM _HappyFunction(@IDs)
GO

-- this will hang
DECLARE @IDs _UniqueIntTable 
SELECT * FROM _SadFunction(@IDs)
GO

誰が推測したでしょうか?

于 2010-01-28T02:35:14.630 に答える
2

CLF UDF dbo.GetAncestors を SQL UDF に置き換えて、SQL 2008 SP1 での動作を再現しました。テーブル値関数とインライン関数の両方を試しました。どちらも違いはありませんでした。

まだ何が起こっているのかわかりませんが、他の人の利益のために、以下に私の定義を含めます.

-- try a recursive inline UDF...
CREATE FUNCTION dbo.GetAncestors(@hierarchyid hierarchyid)
RETURNS TABLE AS RETURN (
WITH recurse AS (
    SELECT @hierarchyid AS Ancestor
    WHERE @hierarchyid IS NOT NULL
    UNION ALL
    SELECT Ancestor.GetAncestor(1) FROM recurse
    WHERE Ancestor.GetAncestor(1) IS NOT NULL
    )
SELECT * FROM recurse
)

-- ...or a table-valued UDF, it makes no difference
CREATE FUNCTION dbo.GetAncestors(@hierarchyid hierarchyid)
RETURNS @return TABLE (Ancestor hierarchyid) 
AS BEGIN
    WHILE @hierarchyid IS NOT NULL BEGIN
        INSERT @return (Ancestor)
        VALUES (@hierarchyid)
        SET @hierarchyid = @hierarchyid.GetAncestor(1)
    END             
    RETURN
END

上記の定義のいずれかを選択し、これを実行してハングするのを確認します。

DECLARE @IDs UniqueIntTable 
INSERT @IDs SELECT ID FROM Hierarchy
RAISERROR('we have inserted %i rows.',-1,-1,@@ROWCOUNT) WITH NOWAIT
SELECT * FROM dbo.GoodFunction(@IDs) a
RAISERROR('we have returned %i rows.',-1,-1,@@ROWCOUNT) WITH NOWAIT
GO

DECLARE @IDs UniqueIntTable 
INSERT @IDs SELECT ID FROM Hierarchy
RAISERROR('we have inserted %i rows.',-1,-1,@@ROWCOUNT) WITH NOWAIT
SELECT * FROM dbo.BadFunction(@IDs) a
RAISERROR('we have returned %i rows.',-1,-1,@@ROWCOUNT) WITH NOWAIT
GO

2 番目のバッチはまったく開始されません。解析段階を通過しますが、バインドと最適化の間のどこかで失われたようです。

両方の関数の本体は、関数ラッパーの外側で、まったく同じ実行計画にコンパイルされます。

SET SHOWPLAN_TEXT ON
GO
DECLARE @IDs UniqueIntTable 
INSERT @IDs SELECT ID FROM Hierarchy
SELECT p.ID, p.Node, p.Name, p.[Level]
FROM
(
    SELECT DISTINCT a.Ancestor AS Node
    FROM Hierarchy c 
    CROSS APPLY dbo.GetAncestors_IF(c.Node.GetAncestor(1)) a
    WHERE c.ID IN (SELECT Value FROM @IDs)
) np
INNER JOIN Hierarchy p
ON p.Node = np.Node

;WITH Ancestors_CTE AS
(
    SELECT DISTINCT a.Ancestor AS Node
    FROM Hierarchy c
    CROSS APPLY dbo.GetAncestors_IF(c.Node.GetAncestor(1)) a
    WHERE c.ID IN (SELECT Value FROM @IDs)
)
SELECT p.ID, p.Node, p.Name, p.[Level]
FROM Ancestors_CTE ac
INNER JOIN Hierarchy p
ON p.Node = ac.Node


-- both return this:

    |--Nested Loops(Inner Join, OUTER REFERENCES:([p].[Node]))
         |--Compute Scalar(DEFINE:([p].[Level]=[Scratch].[dbo].[Hierarchy].[Level] as [p].[Level]))
         |    |--Compute Scalar(DEFINE:([p].[Level]=[Scratch].[dbo].[Hierarchy].[Node] as [p].[Node].GetLevel()))
         |         |--Index Scan(OBJECT:([Scratch].[dbo].[Hierarchy].[IX_Hierarchy_Node] AS [p]))
         |--Top(TOP EXPRESSION:((1)))
              |--Filter(WHERE:([Recr1005]=[Scratch].[dbo].[Hierarchy].[Node] as [p].[Node]))
                   |--Nested Loops(Inner Join, OUTER REFERENCES:([c].[Node]))
                        |--Nested Loops(Inner Join, OUTER REFERENCES:([Value]))
                        |    |--Clustered Index Scan(OBJECT:(@IDs))
                        |    |--Clustered Index Seek(OBJECT:([Scratch].[dbo].[Hierarchy].[PK_Hierarchy] AS [c]), SEEK:([c].[ID]=[Value]) ORDERED FORWARD)
                        |--Index Spool(WITH STACK)
                             |--Concatenation
                                  |--Compute Scalar(DEFINE:([Expr1011]=(0)))
                                  |    |--Constant Scan(VALUES:(([Scratch].[dbo].[Hierarchy].[Node] as [c].[Node].GetAncestor((1)))))
                                  |--Assert(WHERE:(CASE WHEN [Expr1013]>(100) THEN (0) ELSE NULL END))
                                       |--Nested Loops(Inner Join, OUTER REFERENCES:([Expr1013], [Recr1003]))
                                            |--Compute Scalar(DEFINE:([Expr1013]=[Expr1012]+(1)))
                                            |    |--Table Spool(WITH STACK)
                                            |--Compute Scalar(DEFINE:([Expr1004]=[Recr1003].GetAncestor((1))))
                                                 |--Filter(WHERE:(STARTUP EXPR([Recr1003].GetAncestor((1)) IS NOT NULL)))
                                                      |--Constant Scan

とても興味深い。Microsoft Connect でバグ レポートを送信し、何が起こっているかを教えてもらいます。

于 2010-01-28T01:26:49.607 に答える
1

これは推測であり、単なる推測ですが、おそらく、オプティマイザーが最適な実行プランをかなり適切に推測する方法と関係がありますが、完全な検索は行いません。

したがって、クエリの実行は次のように機能します。

解析->バインド->最適化->実行

2つのクエリの解析ツリーは確かに異なります。バインドツリーはおそらく異なります。バインドフェーズについては、結論として十分にわかりませんが、バインドツリー異なると仮定すると、AバインドツリーとBバインドツリーを同じ実行プランにするには、異なる数の変換が必要になる場合があります。

クエリBを約5msの計画に到達させるために、さらに2つの変換が必要な場合、オプティマイザはそれを検出する前に「十分に良い」と言う可能性があります。クエリAの場合、約5ミリ秒の計画は、検索コストのしきい値のすぐ内側にある可能性があります。

于 2010-01-23T04:41:19.883 に答える
0

最初のステートメントでは、結合は

np INNER JOIN Hierarchy p
    ON p.Node = np.Node

あなたの2番目のステートメントは

Ancestors_CTE a
INNER JOIN Hierarchy p
ON p.Node = a.Node

ただし、a は CT の dbo.GetAncestors(c.Node.GetAncestor(1)) のエイリアスとしても使用されます。エイリアスとしての a の二重使用とオプティマイザが混同しないように、Ancestors_CTE aegと交換してみてください。Ancestor_CTE acte

とは言っても、CTE を作成するときに SQL サーバーが正しいインデックスを適用するのにどれほど優れているかはわかりません。以前にこれに問題があり、代わりにテーブル変数を使用して大きな成功を収めました。

于 2010-01-26T22:35:21.463 に答える
-1

私が理解しているように、バッチで CTE を使用する場合は、ステートメントを「;」で終了する必要があります。WITH 句の解釈と関係があります。これを試して:

IF OBJECT_ID('_HappyFunction' ) IS NOT NULL DROP FUNCTION _HappyFunction  
IF OBJECT_ID('_NowHappyFunction') IS NOT NULL DROP FUNCTION _NowHappyFunction  
IF TYPE_ID  ('_UniqueIntTable') IS NOT NULL DROP TYPE _UniqueIntTable  
GO  

CREATE TYPE _UniqueIntTable AS TABLE (Value int NOT NULL PRIMARY KEY)  
GO  

CREATE FUNCTION _HappyFunction (@IDs _UniqueIntTable READONLY)  
RETURNS TABLE AS RETURN  
  SELECT Value FROM @IDs  
GO  

CREATE FUNCTION _NowHappyFunction (@IDs _UniqueIntTable READONLY)  
RETURNS @Table TABLE
(
Value INT
)
BEGIN
  ;WITH CTE AS (SELECT Value FROM @IDs)
  INSERT INTO @Table
  SELECT Value FROM CTE
  RETURN
END
GO

-- this will return an empty record set  
DECLARE @IDs _UniqueIntTable   
SELECT * FROM _HappyFunction(@IDs)  
GO  

-- this will no longer hang and will also return an empty record set 
DECLARE @IDs _UniqueIntTable   
SELECT * FROM _NowHappyFunction(@IDs)  
GO 
于 2010-07-20T19:14:50.410 に答える