mysql - 3 つのテーブルからの情報を統合する MySQL クエリ (多くの障害を伴う)

Question

背景: ある実験では、ミツバチの背中に番号タグが接着されており、実験室での選択が記録されています。再利用する必要がある十分な数のタグ (2 桁といくつかの色のオプション) がありません。ただし、タグはそれを持っている人が死亡した後にのみ再利用されます。したがって、データ構造には蜂の識別子が時々見られますが、それが同じ蜂からのものかどうかを知る唯一の方法は、別のテーブルを調べて蜂が死んだかどうかを確認することです。

テーブル: ミツバチの選択

CREATE TABLE `exp8` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `bee_id` varchar(255) DEFAULT NULL,
  `date_time` datetime DEFAULT NULL,
  `choice` varchar(255) DEFAULT NULL,
  `hover_duration` int(11) DEFAULT NULL,
  `antennate_duration` int(11) DEFAULT NULL,
  `land_duration` int(11) DEFAULT NULL,
  `landing_position` varchar(255) DEFAULT NULL,
  `remarks` longtext,
  `validity` int(11) DEFAULT '1',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=264;

LOCK TABLES `exp8` WRITE;
/*!40000 ALTER TABLE `exp8` DISABLE KEYS */;

INSERT INTO `exp8` (`id`, `bee_id`, `date_time`, `choice`, `hover_duration`, `antennate_duration`, `land_duration`, `landing_position`, `remarks`, `validity`)
VALUES
    (1,NULL,'2013-05-14 15:38:31','right',1,0,0,NULL,NULL,1),
    (2,NULL,'2013-05-18 10:27:15','left',1,0,0,NULL,NULL,1),
    (3,'G5','2013-05-18 11:44:44','left',0,0,4,'yellow',NULL,1),
    (4,'G5','2013-06-01 10:00:00','left',0,0,4,'yellow',NULL,1);

出生時間と死亡時間のタグ

CREATE TABLE `tags` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `bee_id` varchar(255) DEFAULT NULL,
  `tag_date` date DEFAULT NULL,
  `colony_id` int(11) DEFAULT NULL,
  `events` varchar(255) DEFAULT NULL,
  `worker_age` varchar(255) DEFAULT NULL,
  `tagged_by` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`id`)
) TYPE=InnoDB AUTO_INCREMENT=406;

LOCK TABLES `tags` WRITE;
/*!40000 ALTER TABLE `tags` DISABLE KEYS */;

INSERT INTO `tags` (`id`, `bee_id`, `tag_date`, `colony_id`, `events`, `worker_age`, `tagged_by`)
VALUES
    (1,'G5','2013-05-08',1,'birth','Adult','ET'),
    (2,'G5','2013-05-20',NULL,'death','Adult','ET'),
    (3,'G5','2013-05-29',1,'birth','Adult','ET');

ラボで表示されている刺激

CREATE TABLE `stimuli_schedule` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `left_side` varchar(255) DEFAULT NULL,
  `right_side` varchar(255) DEFAULT NULL,
  `start_datetime` datetime DEFAULT NULL,
  `scheduled` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) TYPE=InnoDB AUTO_INCREMENT=50;

LOCK TABLES `stimuli_schedule` WRITE;
/*!40000 ALTER TABLE `stimuli_schedule` DISABLE KEYS */;

INSERT INTO `stimuli_schedule` (`id`, `left_side`, `right_side`, `start_datetime`, `scheduled`)
VALUES
    (1,'LS1','LS2','2013-05-14 12:00:00',NULL),
    (2,'LS2','LS1','2013-05-15 11:44:00',NULL),
    (3,'LS1','LS2','2013-05-30 11:09:00',NULL);

望ましい出力は次のようなものです。

bee_id     CHOICE_DATETIME     LEFT_SIDE     RIGHT_SIDE     CHOICE
===================================================================
NULL       2013-05-14 15:38:31     LS1          LS2           right
G5         2013-05-18 10:27:15     LS2          LS1           left
G5         2013-06-01 10:00:00     LS1          LS2           left

@GordonLinoff と @jcsanyi の寛大な助けのおかげで、ソリューションの一部を実現する 2 つの関連する MySQL クエリがあります。

このビットは、ミツバチの ID が一意であると仮定して、個々のミツバチの選択を示します。

select bee_id, count(case when choice="left" then 1 else NULL end) as leftCount, count(case when choice="right" then 1 else NULL end) as rightCount
  from exp8 e
  left join stimuli_schedule ss on ss.start_datetime <= e.date_time
  left join stimuli_schedule ss2 on ss2.start_datetime <= e.date_time
  where (bee_id IS NOT NULL) AND (ss2.left_side IN ('LA1','HS1') AND ss2.right_side IN('HS1','LA1'))
  group by bee_id

このビットはミツバチの寿命を示すことができ、再利用されたタグを区別します。

select t.bee_id, (case when t.death_date is null then 'Alive' else 'Dead' end) as status, 
        t.tag_date, t.death_date, (case when t.death_date is not null then timediff(t.death_date,t.tag_date) else timediff(NOW(),t.tag_date) end) as age
from (select t.*,
             (select t2.tag_date
              from tags t2
              where t2.bee_id = t.bee_id and
                    t2.events = 'death' and
                    t2.tag_date >= t.tag_date
              limit 1
             ) as death_date
      from tags t
      where t.events = 'birth'
     ) t
group by t.bee_id, t.tag_date;

2 つのクエリを組み合わせて目的の出力を生成するのに問題があります。これが私の試みです：

select t.bee_id, count(case when choice="left" then 1 else NULL end) as leftCount,
       count(case when choice="right" then 1 else NULL end) as rightCount, 
       (case when t.death_date is null then 'Alive' else 'Dead' end) as status, 
       t.tag_date, t.death_date, 
       (case when t.death_date is not null 
             then timediff(t.death_date,t.tag_date) 
             else timediff(NOW(),t.tag_date) end) as "age (hours)"
from exp8 e, (select t.*,
             (select t2.tag_date
              from tags t2
              where t2.bee_id = t.bee_id and
                    t2.events = 'death' and
                    t2.tag_date >= t.tag_date
              limit 1
             ) as death_date
      from tags t
      where t.events = 'birth'
     ) t
left join stimuli_schedule ss on ss.start_datetime <= e.date_time
left join stimuli_schedule ss2 on ss2.start_datetime <= e.date_time
where (e.bee_id IS NOT NULL)
group by t.bee_id, t.tag_date;

私の理解を超えた理由により、左側の e.date_time 部分が「不明な列」エラーを引き起こしています。

どんな助けでも大歓迎です！

score 1 · Accepted Answer

現状では、JOIN演算子は、明らかに意図したように exp8 ではなく、派生テーブル t に関連付けられています。これは、2 つの異なる結合構文を組み合わせることで得られるものです。また、bee_id で t を exp8 に参加させたいと思うでしょう。

score 0 · Accepted Answer

あなたの問題は、データベースの設計自体にあります。行動はミツバチに起因します。そのミツバチは一意に識別される必要があります。そのため、ミツバチの主キーが必要であり、そのミツバチ ID に従って動作をコーディングできます。

秘訣は、タグを処理するときに、現在どのミツバチがそのタグを持っているかを判断する必要があるということです。現在展開されているタグを一覧表示するテーブルで簡単に実行できます。ミツバチが死亡し、タグが再割り当てまたは廃止されると、アクティブなタグのリストが更新されます。

これで私がどこに向かっているのかがわかれば、データ分析フェーズで行っている選択は非常に複雑です。欠落している主キーを模倣し、不必要に動作エントリに適用しようとしているためです。設計を修正すると、データ分析が何倍も速くなり、クエリがはるかに簡単になります。

mysql - 3 つのテーブルからの情報を統合する MySQL クエリ (多くの障害を伴う)

2 に答える 2

Related

Reference