0

次のようなデータを含むテーブルがある場合:

x1      y1      x2      y2

A001     1      B001    2
A001     1      B002    2
A002     2      A001    1
C001     2      B003    3
C002     1      B003    3

次のような結果を得るには、SQL クエリ (Microsoft SQL サーバー) のように見えます。

GroupId      x      y
1            A001   1
1            B001   2
1            B002   2
1            A002   2
2            C001   2
2            C002   1
2            B003   3

次のような等しいペアをグループ化することについてです: if a == b and b == c then a == c

4

2 に答える 2

2

再帰が必要ない場合は、dense_rank()関数を使用して実行できます。

;with cte1(x, y, xp, yp) as (
  select x1, y1, x2, y2 from Table1 union all
  select x2, y2, x1, y1 from Table1
), cte2 as (
  select
      x, y, xp, yp,
      case
          when x < xp then x + cast(y as nvarchar(max))
          else xp + cast(yp as nvarchar(max))
      end as grp
   from cte1  
)
select distinct
   x, y,
   dense_rank() over (order by grp) as grp
from cte2
order by grp, x, y

役立つ希望の例を含むSQLフィドルを参照してください

更新実際には、テーブル変数を使用する方が簡単であることがわかりました。

declare @Table2 table (x varchar(4), y int, grp int)
declare @Table3 table (x varchar(4), y int, xp varchar(4), yp int)
declare @i int = 1

insert into @Table2
select x, y, row_number() over (order by x, y) as grp
from
(
    select distinct x1, y1 from @Table1 union
    select distinct x2, y2 from @Table1
) as a(x, y)

insert into @Table3
select x1, y1, x2, y2 from @Table1 union
select x2, y2, x1, y1 from @Table1

while @i > 0
begin
    update T2 set
        grp = T4.grp
    from @Table2 as T2
        inner join @Table3 as T3 on T3.x = T2.x and T3.y = T2.y
        inner join @Table2 as T4 on T4.x = T3.xp and T4.y = T3.yp
    where T4.grp < T2.grp

    select @i = @@rowcount
end

select x, y, dense_rank() over (order by grp)
from @Table2

SQLフィドル

于 2013-08-08T06:43:54.693 に答える
1

さて、いくつか試してみたところ、次のことがわかりました。

DECLARE @mod int; SET @mod=1;
DECLARE @newgrp int; SET @newgrp=1;
CREATE TABLE tbl([x1] varchar(4), [y1] int, [x2] varchar(4), [y2] int);
INSERT INTO tbl
    ([x1], [y1], [x2], [y2])
          SELECT 'A001', 1, 'B001', 2  -- modified input to create chained equalities:
UNION ALL SELECT 'B001', 2, 'B002', 2  -- --> replaced A001 1 by B001 2
UNION ALL SELECT 'A002', 2, 'B002', 1  
UNION ALL SELECT 'C001', 2, 'B003', 3
UNION ALL SELECT 'C002', 1, 'B003', 3;

SELECT  x,y,0 grp INTO tmp FROM (
 SELECT x1 x,y1 y FROM tbl union SELECT x2 x, y2 y FROM tbl ) t;

-- set first seed: grp=1 on first ID only ...
UPDATE TOP(1) tmp SET grp=1;

-- now iteratively populate the tmp table 
WHILE @newgrp>0                         -- for each group
BEGIN 
 WHILE @mod>0 
  BEGIN                          -- in case of chained equalities
   UPDATE t2 SET grp=tmp.grp FROM tmp 
   INNER JOIN ( SELECT x1,x2 FROM tbl 
          UNION SELECT x2,x1 FROM tbl ) -- do group assignments in both directions!
              tt     ON tt.x1 = tmp.x AND tmp.grp>0
   INNER JOIN tmp t2 ON  t2.x = x2 AND t2.grp=0
   SET @mod=@@ROWCOUNT;
  END 
 -- OK, move on to the next group and then repeat the game ...
 UPDATE TOP(1) tmp SET grp=(SELECT MAX(grp) FROM tmp)+1 WHERE grp=0
 SELECT @newgrp=@@ROWCOUNT, @mod=1;
END

-- show the result
SELECT * FROM tmp

結果:

x    y   grp
---- --- ---
A001 1   1
A002 2   1
B001 2   1
B002 2   1
B003 3   2
C001 2   2
C002 1   2

推奨されるサンプル スクリプトは、列 y が比較に関連していないことを前提としています (サンプル データには、各 x 値に対して正確に 1 つの y 値があります)。もちろん、必要に応じて y 列を比較プロセスに含めることもできます。

編集:

Et violá (比較には y 列も含まれるようになりました): そして ...ここにSQLfiddleがあります (最初にセミコロンを入れすぎました - 愚かな私)!

CREATE TABLE tbl([x1] varchar(4), [y1] int, [x2] varchar(4), [y2] int);
INSERT INTO tbl
    (x1, y1, x2, y2)
          SELECT 'A001', 1, 'B001', 2
UNION ALL SELECT 'A001', 1, 'B002', 2
UNION ALL SELECT 'A002', 2, 'A001', 1
UNION ALL SELECT 'D001', 3, 'B003', 3
UNION ALL SELECT 'D003', 1, 'D001', 3
UNION ALL SELECT 'D001', 1, 'A001', 1
UNION ALL SELECT 'C001', 2, 'B003', 3
UNION ALL SELECT 'C002', 1, 'B003', 3

-- start of processing ...

SELECT  x,y,0 grp INTO tmp FROM (
 SELECT x1 x,y1 y FROM tbl union SELECT x2 x, y2 y FROM tbl ) t;

DECLARE @mod int
SET @mod=1
DECLARE @newgrp int 
SET @newgrp=1

UPDATE TOP(1) tmp SET grp=1  -- set first grp-label (seed)

-- now iteratively populate the tmp table 
WHILE @newgrp>0                         -- for each group
BEGIN 
 WHILE @mod>0                           -- in case of chained equalities
 BEGIN
   UPDATE t2 SET grp=tmp.grp FROM tmp 
   INNER JOIN ( SELECT x1,y1,x2,y2 FROM tbl 
          UNION SELECT x2,y2,x1,y1 FROM tbl ) -- do group assignments in both directions!
              tt     ON tt.x1 = tmp.x AND tt.y1 = tmp.y AND tmp.grp>0
   INNER JOIN tmp t2 ON  t2.x = tt.x2 AND  t2.y = tt.y2 AND t2.grp=0
   SET @mod=@@ROWCOUNT
 -- OK, move on to the next group and then repeat the game ...
 END
 UPDATE TOP(1) tmp SET grp=(SELECT MAX(grp) FROM tmp)+1 WHERE grp=0
 SELECT @newgrp=@@ROWCOUNT, @mod=1
END

-- show the result
SELECT * FROM tmp
-- and drop tmp again
DROP TABLE tmp

また、いくつかのサンプル データを追加して、チェーンされた等価性( 'D001' 3='B003' 3'D003' 1= ) を示し、異なる y 値 (と)'D001' 3を持つケースを作成しました。最初は @@ROWCOUNT の内容に十分な注意を払っていなかったので、ループに頭が痛くなりました...今ではまた動作するはずです!'D001',1'D001' 3while

チェーン化された等価ケース (再帰) が、このクエリの主な問題でした。そうでない場合は、すべてを単一のステートメントで実行できます。@Roman Pekar を参照してください)。

私の(拡張された)例の結果:

x       y    grp
------  ---  ----
A001    1    1
A002    2    1
B001    2    1
B002    2    1
B003    3    2
C001    2    2
C002    1    2
D001    1    1
D001    3    2
D003    1    2
于 2013-08-07T16:46:23.857 に答える