39

純粋なSQLで解決できると信じている興味深い難問があります。次のようなテーブルがあります。

responses:

user_id | question_id | body
----------------------------
1       | 1           | Yes
2       | 1           | Yes
1       | 2           | Yes
2       | 2           | No
1       | 3           | No
2       | 3           | No


questions:

id | body
-------------------------
1 | Do you like apples?
2 | Do you like oranges?
3 | Do you like carrots?

次の出力を取得したい

user_id | Do you like apples? | Do you like oranges? | Do you like carrots?
---------------------------------------------------------------------------
1       | Yes                 | Yes                  | No
2       | Yes                 | No                   | No

質問がいくつあるかわかりませんが、動的になるため、すべての質問をコーディングすることはできません。私はPostgreSQLを使用しており、これは転置と呼ばれていると思いますが、SQLでこれを行う標準的な方法を示すものは何も見つからないようです。大学時代にデータベースクラスでこれを行ったことを覚えていますが、MySQLで行われたため、正直なところ、どのように行ったかは覚えていません。

結合とGROUP BYステートメントの組み合わせになると思いますが、どのように始めればよいのかさえわかりません。

誰かがこれを行う方法を知っていますか?どうもありがとう!

編集1:私が欲しいと思われるクロス集計の使用に関する情報を見つけましたが、それを理解するのに苦労しています。より良い記事へのリンクをいただければ幸いです。

4

5 に答える 5

51

使用する:

  SELECT r.user_id,
         MAX(CASE WHEN r.question_id = 1 THEN r.body ELSE NULL END) AS "Do you like apples?",
         MAX(CASE WHEN r.question_id = 2 THEN r.body ELSE NULL END) AS "Do you like oranges?",
         MAX(CASE WHEN r.question_id = 3 THEN r.body ELSE NULL END) AS "Do you like carrots?"
    FROM RESPONSES r
    JOIN QUESTIONS q ON q.id = r.question_id
GROUP BY r.user_id

データを行から列データに「ピボット」するため、これは標準のピボットクエリです。

于 2010-01-20T05:27:22.887 に答える
12

特定のクラスの回答をハードコーディングしたり、外部モジュール/拡張機能を使用したりすることなく、この問題を処理するための真に動的な関数を実装しました。また、列の順序を完全に制御し、複数のキー列とクラス/属性列をサポートします。

ここで見つけることができます:https ://github.com/jumpstarter-io/colpivot

この特定の問題を解決する例:

begin;

create temporary table responses (
    user_id integer,
    question_id integer,
    body text
) on commit drop;

create temporary table questions (
    id integer,
    body text
) on commit drop;

insert into responses values (1,1,'Yes'), (2,1,'Yes'), (1,2,'Yes'), (2,2,'No'), (1,3,'No'), (2,3,'No');
insert into questions values (1, 'Do you like apples?'), (2, 'Do you like oranges?'), (3, 'Do you like carrots?');

select colpivot('_output', $$
    select r.user_id, q.body q, r.body a from responses r
        join questions q on q.id = r.question_id
$$, array['user_id'], array['q'], '#.a', null);

select * from _output;

rollback;

これは以下を出力します:

 user_id | 'Do you like apples?' | 'Do you like carrots?' | 'Do you like oranges?' 
---------+-----------------------+------------------------+------------------------
       1 | Yes                   | No                     | Yes
       2 | Yes                   | No                     | No
于 2015-10-19T01:04:41.503 に答える
6

このようにクロス集計関数でこの例を解くことができます

drop table if exists responses;
create table responses (
user_id integer,
question_id integer,
body text
);

drop table if exists questions;
create table questions (
id integer,
body text
);

insert into responses values (1,1,'Yes'), (2,1,'Yes'), (1,2,'Yes'), (2,2,'No'), (1,3,'No'), (2,3,'No');
insert into questions values (1, 'Do you like apples?'), (2, 'Do you like oranges?'), (3, 'Do you like carrots?');

select * from crosstab('select responses.user_id, questions.body, responses.body from responses, questions where questions.id = responses.question_id order by user_id') as ct(userid integer, "Do you like apples?" text, "Do you like oranges?" text, "Do you like carrots?" text);

まず、tablefunc拡張機能をインストールする必要があります。9.1バージョン以降、createextensionを使用して実行できます。

CREATE EXTENSION tablefunc;
于 2012-11-21T14:45:31.447 に答える
4

動的クエリを生成する関数を作成しました。クロス集計のSQLを生成し、ビューを作成します(存在する場合は最初にドロップします)。次に、ビューから選択して結果を取得できます。

関数は次のとおりです。

CREATE OR REPLACE FUNCTION public.c_crosstab (
  eavsql_inarg varchar,
  resview varchar,
  rowid varchar,
  colid varchar,
  val varchar,
  agr varchar
)
RETURNS void AS
$body$
DECLARE
    casesql varchar;
    dynsql varchar;    
    r record;
BEGIN   
 dynsql='';

 for r in 
      select * from pg_views where lower(viewname) = lower(resview)
  loop
      execute 'DROP VIEW ' || resview;
  end loop;   

 casesql='SELECT DISTINCT ' || colid || ' AS v from (' || eavsql_inarg || ') eav ORDER BY ' || colid;
 FOR r IN EXECUTE casesql Loop
    dynsql = dynsql || ', ' || agr || '(CASE WHEN ' || colid || '=''' || r.v || ''' THEN ' || val || ' ELSE NULL END) AS ' || agr || '_' || r.v;
 END LOOP;
 dynsql = 'CREATE VIEW ' || resview || ' AS SELECT ' || rowid || dynsql || ' from (' || eavsql_inarg || ') eav GROUP BY ' || rowid;
 RAISE NOTICE 'dynsql %1', dynsql; 
 EXECUTE dynsql;
END

$body$
LANGUAGE 'plpgsql'
VOLATILE
CALLED ON NULL INPUT
SECURITY INVOKER
COST 100;

そして、これが私がそれを使う方法です:

SELECT c_crosstab('query_txt', 'view_name', 'entity_column_name', 'attribute_column_name', 'value_column_name', 'first');

例:実行する拳:

SELECT c_crosstab('Select * from table', 'ct_view', 'usr_id', 'question_id', 'response_value', 'first');

よりも:

Select * from ct_view;
于 2014-09-26T13:48:03.267 に答える
-2

にこの例がありcontrib/tablefunc/ます。

于 2010-01-20T05:16:57.483 に答える