追加のモジュールtablefuncをインストールしていない場合は、データベースごとに次のコマンドを1回実行します。
CREATE EXTENSION tablefunc;
質問への回答
あなたのケースのための非常に基本的なクロス集計ソリューション:
SELECT * FROM crosstab(
'SELECT bar, 1 AS cat, feh
FROM tbl_org
ORDER BY bar, feh')
AS ct (bar text, val1 int, val2 int, val3 int); -- more columns?
ここでの特別な難しさは、ベーステーブルにカテゴリ( )がないことです。cat
基本的な1パラメータ形式の場合、カテゴリとして機能するダミー値を持つダミー列を提供できます。とにかく値は無視されます。
これは、関数の2番目のパラメーターが不要なまれなケースの1つです。これは、この問題の定義により、すべての値が右側のぶら下がっている列にのみ表示されるためです。そして、順序は値によって決定できます。crosstab()
NULL
結果の値の順序を決定する名前を持つ実際のカテゴリ列がある場合は、 2パラメータ形式のが必要になりますcrosstab()
。row_number()
ここでは、以下に基づいて、ウィンドウ関数を使用してカテゴリ列を合成しますcrosstab()
。
SELECT * FROM crosstab(
$$
SELECT bar, val, feh
FROM (
SELECT *, 'val' || row_number() OVER (PARTITION BY bar ORDER BY feh) AS val
FROM tbl_org
) x
ORDER BY 1, 2
$$
, $$VALUES ('val1'), ('val2'), ('val3')$$ -- more columns?
) AS ct (bar text, val1 int, val2 int, val3 int); -- more columns?
残りはほとんどありふれたものです。これらの密接に関連する回答で、より多くの説明とリンクを見つけてください。
基本:機能
に慣れていない場合は、最初にこれを読んでくださいcrosstab()
!
高度:
適切なテスト設定
これが、最初にテストケースを提供する方法です。
CREATE TEMP TABLE tbl_org (id int, feh int, bar text);
INSERT INTO tbl_org (id, feh, bar) VALUES
(1, 10, 'A')
, (2, 20, 'A')
, (3, 3, 'B')
, (4, 4, 'B')
, (5, 5, 'C')
, (6, 6, 'D')
, (7, 7, 'D')
, (8, 8, 'D');
動的クロス集計?
@Clodoaldoがコメントしたように、まだあまり動的ではありません。動的リターンタイプは、plpgsqlでは実現が困難です。しかし、それを回避する方法があります-いくつかの制限があります。
したがって、残りの部分をさらに複雑にしないために、より単純なテストケースでデモンストレーションします。
CREATE TEMP TABLE tbl (row_name text, attrib text, val int);
INSERT INTO tbl (row_name, attrib, val) VALUES
('A', 'val1', 10)
, ('A', 'val2', 20)
, ('B', 'val1', 3)
, ('B', 'val2', 4)
, ('C', 'val1', 5)
, ('D', 'val3', 8)
, ('D', 'val1', 6)
, ('D', 'val2', 7);
電話:
SELECT * FROM crosstab('SELECT row_name, attrib, val FROM tbl ORDER BY 1,2')
AS ct (row_name text, val1 int, val2 int, val3 int);
戻り値:
row_name | val1 | val2 | val3
----------+------+------+------
A | 10 | 20 |
B | 3 | 4 |
C | 5 | |
D | 6 | 7 | 8
tablefunc
モジュールの組み込み機能
tablefuncモジュールはcrosstab()
、列定義リストを提供せずに、汎用呼び出しのための単純なインフラストラクチャーを提供します。で書かれたいくつかの関数 C
(通常は非常に高速):
crosstabN()
crosstab1()
-crosstab4()
事前定義されています。1つのマイナーなポイント:それらはすべてを要求し、返しますtext
。したがって、integer
値をキャストする必要があります。しかし、それは呼び出しを単純化します:
SELECT * FROM crosstab4('SELECT row_name, attrib, val::text -- cast!
FROM tbl ORDER BY 1,2')
結果:
row_name | category_1 | category_2 | category_3 | category_4
----------+------------+------------+------------+------------
A | 10 | 20 | |
B | 3 | 4 | |
C | 5 | | |
D | 6 | 7 | 8 |
カスタムcrosstab()
機能
より多くの列または他のデータ型については、独自の複合型と関数を(1回)作成します。
タイプ:
CREATE TYPE tablefunc_crosstab_int_5 AS (
row_name text, val1 int, val2 int, val3 int, val4 int, val5 int);
働き:
CREATE OR REPLACE FUNCTION crosstab_int_5(text)
RETURNS SETOF tablefunc_crosstab_int_5
AS '$libdir/tablefunc', 'crosstab' LANGUAGE c STABLE STRICT;
電話:
SELECT * FROM crosstab_int_5('SELECT row_name, attrib, val -- no cast!
FROM tbl ORDER BY 1,2');
結果:
row_name | val1 | val2 | val3 | val4 | val5
----------+------+------+------+------+------
A | 10 | 20 | | |
B | 3 | 4 | | |
C | 5 | | | |
D | 6 | 7 | 8 | |
すべての人に1つの多形で動的な関数
tablefunc
これは、モジュールでカバーされているものを超えています。
戻り型を動的にするために、この関連する回答で詳しく説明されている手法を使用して、ポリモーフィック型を使用します。
1パラメータ形式:
CREATE OR REPLACE FUNCTION crosstab_n(_qry text, _rowtype anyelement)
RETURNS SETOF anyelement AS
$func$
BEGIN
RETURN QUERY EXECUTE
(SELECT format('SELECT * FROM crosstab(%L) t(%s)'
, _qry
, string_agg(quote_ident(attname) || ' ' || atttypid::regtype
, ', ' ORDER BY attnum))
FROM pg_attribute
WHERE attrelid = pg_typeof(_rowtype)::text::regclass
AND attnum > 0
AND NOT attisdropped);
END
$func$ LANGUAGE plpgsql;
2パラメータ形式のこのバリアントでオーバーロードします。
CREATE OR REPLACE FUNCTION crosstab_n(_qry text, _cat_qry text, _rowtype anyelement)
RETURNS SETOF anyelement AS
$func$
BEGIN
RETURN QUERY EXECUTE
(SELECT format('SELECT * FROM crosstab(%L, %L) t(%s)'
, _qry, _cat_qry
, string_agg(quote_ident(attname) || ' ' || atttypid::regtype
, ', ' ORDER BY attnum))
FROM pg_attribute
WHERE attrelid = pg_typeof(_rowtype)::text::regclass
AND attnum > 0
AND NOT attisdropped);
END
$func$ LANGUAGE plpgsql;
pg_typeof(_rowtype)::text::regclass
:ユーザー定義の複合型ごとに行型が定義されているため、属性(列)がシステムカタログに一覧表示されますpg_attribute
。それを取得するための高速レーン:登録されたタイプ(regtype
)をtext
にキャストし、これtext
をにキャストしregclass
ます。
複合型を1回作成します。
使用するすべての返品タイプを1回定義する必要があります。
CREATE TYPE tablefunc_crosstab_int_3 AS (
row_name text, val1 int, val2 int, val3 int);
CREATE TYPE tablefunc_crosstab_int_4 AS (
row_name text, val1 int, val2 int, val3 int, val4 int);
...
アドホックコールの場合、同じ(一時的な)効果をもたらす一時的なテーブルを作成することもできます。
CREATE TEMP TABLE temp_xtype7 AS (
row_name text, x1 int, x2 int, x3 int, x4 int, x5 int, x6 int, x7 int);
または、既存のテーブル、ビュー、または可能であればマテリアライズド・ビューのタイプを使用します。
電話
上記の行タイプの使用:
1パラメーター形式(欠落値なし):
SELECT * FROM crosstab_n(
'SELECT row_name, attrib, val FROM tbl ORDER BY 1,2'
, NULL::tablefunc_crosstab_int_3);
2パラメータ形式(一部の値が欠落している可能性があります):
SELECT * FROM crosstab_n(
'SELECT row_name, attrib, val FROM tbl ORDER BY 1'
, $$VALUES ('val1'), ('val2'), ('val3')$$
, NULL::tablefunc_crosstab_int_3);
この1つの関数はすべての戻り型に対して機能しますが、モジュールによって提供されるフレームワークには、それぞれに個別の関数が必要です。
上記のようにタイプに順番に名前を付けた場合は、太字の数字を置き換えるだけで済みます。基本テーブルでカテゴリの最大数を見つけるには、次のようにします。crosstabN()
tablefunc
SELECT max(count(*)) OVER () FROM tbl -- returns 3
GROUP BY row_name
LIMIT 1;
これは、個々の列が必要な場合と同じくらい動的です。@Clocoaldoで示されるような配列、単純なテキスト表現、またはドキュメントタイプでラップされた結果は、json
任意hstore
の数のカテゴリで動的に機能します。
免責事項:
ユーザー入力がコードに変換されると、常に潜在的に危険です。これをSQLインジェクションに使用できないことを確認してください。信頼できないユーザーからの入力を(直接)受け入れないでください。
元の質問を求める:
SELECT * FROM crosstab_n('SELECT bar, 1, feh FROM tbl_org ORDER BY 1,2'
, NULL::tablefunc_crosstab_int_3);