3

Membershipsというテーブルを含むSQLServer2005データベースがあります。

テーブルスキーマは次のとおりです。

PersonID int, Surname nvarchar(30), FirstName nvarchar(30), Description nvarchar(100), StartDate datetime, EndDate datetime

私は現在、個人ごとのメンバーシップの内訳を表示するグリッド機能に取り組んでいます。要件の1つは、日付範囲が交差する場所でメンバーシップ行を分割することです。交差はSurnameとFirstNameでバインドする必要があります。つまり、分割は同じSurnameとFirstNameのメンバーシップレコードでのみ発生します。

テーブルデータの例:

18スミスジョンポーカークラブ2009年1月1日NULL
18スミスジョン図書館2009年5月1日2009年1月18日
18スミスジョンジム2009年10月1日2009年1月28日
26アダムスジェーンピラティス2009年3月1日2009年2月16日

期待される結果セット:

18スミスジョンポーカークラブ2009年1月1日2009年4月1日
18スミスジョンポーカークラブ/ライブラリー2009年5月1日2009年9月1日
18スミスジョンポーカークラブ/図書館/ジム2009年10月1日2009年1月18日
18スミスジョンポーカークラブ/ジム2009年1月19日2009年1月28日
18スミスジョンポーカークラブ2009年1月29日NULL
26アダムスジェーンピラティス2009年3月1日2009年2月16日

上記の内訳を持つ結果セットを返すストアドプロシージャを作成する方法を誰かが知っていますか?

4

3 に答える 3

2

この問題で発生する問題は、データセットが大きくなるにつれて、TSQLでそれを解決するためのソリューションが適切に拡張されないことです。以下は、問題を解決するためにオンザフライで構築された一連の一時テーブルを使用しています。数値テーブルを使用して、各日付範囲エントリをそれぞれの日に分割します。これは、主に無限に見えるオープンレンジのNULL値が原因でスケーリングされないため、変換の範囲を実行可能な時間に制限する遠い将来の固定日にスワップする必要があります。毎日のレンダリングを最適化するために、適切なインデックスを使用して日表またはカレンダー表を作成すると、パフォーマンスが向上する可能性があります。

範囲が分割されると、XML PATHを使用して説明がマージされ、範囲シリーズの毎日にすべての説明がリストされます。PersonIDと日付による行番号付けにより、2つのNOT EXISTSチェックを使用して各範囲の最初と最後の行を検索し、一致するPersonIDとDescriptionセットの前の行が存在しない場合、または次の行が存在しない場合を見つけることができます。一致するPersonIDとDescriptionセットに対して存在します。

次に、この結果セットはROW_NUMBERを使用して番号が付け直され、ペアになって最終結果を作成できるようになります。

/*
SET DATEFORMAT dmy
USE tempdb;
GO
CREATE TABLE Schedule
( PersonID int, 
 Surname nvarchar(30), 
 FirstName nvarchar(30), 
 Description nvarchar(100), 
 StartDate datetime, 
 EndDate datetime)
GO
INSERT INTO Schedule VALUES (18, 'Smith', 'John', 'Poker Club', '01/01/2009', NULL)
INSERT INTO Schedule VALUES (18, 'Smith', 'John', 'Library', '05/01/2009', '18/01/2009')
INSERT INTO Schedule VALUES (18, 'Smith', 'John', 'Gym', '10/01/2009', '28/01/2009')
INSERT INTO Schedule VALUES (26, 'Adams', 'Jane', 'Pilates', '03/01/2009', '16/02/2009')
GO

*/

SELECT 
 PersonID, 
 Description, 
 theDate
INTO #SplitRanges
FROM Schedule, (SELECT DATEADD(dd, number, '01/01/2008') AS theDate
    FROM master..spt_values
    WHERE type = N'P') AS DayTab
WHERE theDate >= StartDate 
  AND theDate <= isnull(EndDate, '31/12/2012')

SELECT 
 ROW_NUMBER() OVER (ORDER BY PersonID, theDate) AS rowid,
 PersonID, 
 theDate, 
 STUFF((
  SELECT '/' + Description
  FROM #SplitRanges AS s
  WHERE s.PersonID = sr.PersonID 
    AND s.theDate = sr.theDate
  FOR XML PATH('')
  ), 1, 1,'') AS Descriptions
INTO #MergedDescriptions
FROM #SplitRanges AS sr
GROUP BY PersonID, theDate


SELECT 
 ROW_NUMBER() OVER (ORDER BY PersonID, theDate) AS ID, 
 *
INTO #InterimResults
FROM
(
 SELECT * 
 FROM #MergedDescriptions AS t1
 WHERE NOT EXISTS 
  (SELECT 1 
   FROM #MergedDescriptions AS t2 
   WHERE t1.PersonID = t2.PersonID 
     AND t1.RowID - 1 = t2.RowID 
     AND t1.Descriptions = t2.Descriptions)
UNION ALL
 SELECT * 
 FROM #MergedDescriptions AS t1
 WHERE NOT EXISTS 
  (SELECT 1 
   FROM #MergedDescriptions AS t2 
   WHERE t1.PersonID = t2.PersonID 
     AND t1.RowID = t2.RowID - 1
     AND t1.Descriptions = t2.Descriptions)
) AS t

SELECT DISTINCT 
 PersonID, 
 Surname, 
 FirstName
INTO #DistinctPerson
FROM Schedule

SELECT 
 t1.PersonID, 
 dp.Surname, 
 dp.FirstName, 
 t1.Descriptions, 
 t1.theDate AS StartDate, 
 CASE 
  WHEN t2.theDate = '31/12/2012' THEN NULL 
  ELSE t2.theDate 
 END AS EndDate
FROM #DistinctPerson AS dp
JOIN #InterimResults AS t1 
 ON t1.PersonID = dp.PersonID
JOIN #InterimResults AS t2 
 ON t2.PersonID = t1.PersonID 
  AND t1.ID + 1 = t2.ID 
  AND t1.Descriptions = t2.Descriptions

DROP TABLE #SplitRanges
DROP TABLE #MergedDescriptions
DROP TABLE #DistinctPerson
DROP TABLE #InterimResults

/*

DROP TABLE Schedule

*/

上記のソリューションは、追加の説明間のギャップも処理するため、PersonID 18に別の説明を追加すると、ギャップが残ります。

INSERT INTO Schedule VALUES (18, 'Smith', 'John', 'Gym', '10/02/2009', '28/02/2009')

ギャップを適切に埋めます。コメントで指摘されているように、このテーブルには名前情報を含めるべきではありません。最終結果で参加できるPersonsテーブルに正規化する必要があります。SELECT DISTINCTを使用して一時テーブルを作成し、そのJOINを作成することにより、この他のテーブルをシミュレートしました。

于 2009-09-12T06:44:40.160 に答える
1

これを試して

SET DATEFORMAT dmy
DECLARE @Membership TABLE( 
    PersonID    int, 
    Surname     nvarchar(16), 
    FirstName   nvarchar(16), 
    Description nvarchar(16), 
    StartDate   datetime, 
    EndDate     datetime)   
INSERT INTO @Membership VALUES (18, 'Smith', 'John', 'Poker Club', '01/01/2009', NULL)
INSERT INTO @Membership VALUES (18, 'Smith', 'John','Library', '05/01/2009', '18/01/2009')
INSERT INTO @Membership VALUES (18, 'Smith', 'John','Gym', '10/01/2009', '28/01/2009')
INSERT INTO @Membership VALUES (26, 'Adams', 'Jane','Pilates', '03/01/2009', '16/02/2009')

--Program Starts
declare @enddate datetime
--Measuring extreme condition when all the enddates are null(i.e. all the memberships for all members are in progress)
-- in such a case taking any arbitary date e.g. '31/12/2009' here else add 1 more day to the highest enddate
select @enddate =  case when max(enddate) is null then '31/12/2009' else max(enddate) + 1 end from @Membership

--Fill the null enddates
; with fillNullEndDates_cte as
(
    select
            row_number() over(partition by PersonId order by PersonId) RowNum
            ,PersonId
            ,Surname
            ,FirstName
            ,Description
            ,StartDate
            ,isnull(EndDate,@enddate) EndDate
    from @Membership
)
--Generate a date calender
, generateCalender_cte as
(
    select 
        1 as CalenderRows
        ,min(startdate) DateValue
    from @Membership
       union all
        select 
            CalenderRows+1
            ,DateValue + 1
        from    generateCalender_cte   
        where   DateValue + 1 <= @enddate
)
--Generate Missing Dates based on Membership
,datesBasedOnMemberships_cte as
 (
    select 
            t.RowNum
            ,t.PersonId
            ,t.Surname
            ,t.FirstName
            ,t.Description          
            , d.DateValue
            ,d.CalenderRows
    from generateCalender_cte d 
    join fillNullEndDates_cte t ON d.DateValue between t.startdate and t.enddate
)
--Generate Dscription Based On Membership Dates
, descriptionBasedOnMembershipDates_cte as
(
    select    
        PersonID
        ,Surname
        ,FirstName
        ,stuff((
            select '/' + Description
            from datesBasedOnMemberships_cte d1
            where d1.PersonID = d2.PersonID 
            and d1.DateValue = d2.DateValue
            for xml path('')
        ), 1, 1,'') as Description
        , DateValue
        ,CalenderRows
    from datesBasedOnMemberships_cte d2
    group by PersonID, Surname,FirstName,DateValue,CalenderRows
)
--Grouping based on membership dates
,groupByMembershipDates_cte as
(
    select d.*,
    CalenderRows - row_number() over(partition by Description order by PersonID, DateValue) AS  [Group]
    from descriptionBasedOnMembershipDates_cte d
)
select PersonId
,Surname
,FirstName
,Description
,convert(varchar(10), convert(datetime, min(DateValue)), 103) as StartDate
,case when max(DateValue)= @enddate then null else convert(varchar(10), convert(datetime, max(DateValue)), 103) end as EndDate
from groupByMembershipDates_cte 
group by [Group],PersonId,Surname,FirstName,Description
order by PersonId,StartDate
option(maxrecursion 0)
于 2009-11-08T03:08:14.060 に答える