ある市の 1993 年から 2000 年までの掲示板システムの月次リストのコレクションを解析しています。目標は、このデータから視覚化することです。たとえば、さまざまな種類の BBS ソフトウェアを使用した BBS の総数を月ごとに示す折れ線グラフです。
これらすべてのリストのデータを、約 17,000 行の 1 つの大きなテーブルにまとめました。各行は、1 か月間の 1 つの BBS を表します。これはおそらく最適なテーブル スキームではないことはわかっていますが、それは別の日の質問です。構造は次のようなものです。
date | name | phone | codes | sysop | speed | software
1990-12 | Aviary | xxx-xxx-xxxx | null | Birdman | 2400 | WWIV
Google Fusion Tables には、「集計」(旧バージョンでは「集計」) と呼ばれる機能があります。「日付」列と「ソフトウェア」列で要約するビューを作成すると、FT は、日付、ソフトウェア、カウントの 3 つの列を持つ約 500 行のテーブルを生成します。各行には、特定の月に特定の種類のソフトウェアを使用した BBS の数が一覧表示されます。このデータを使用して、上で説明したグラフを作成できます。
それで、今私の質問に。FT ではなく、MySQL でこのデータを処理したいと考えています。同じ 17,000 行のテーブルを MySQL データベースにインポートし、FT の Summarize 関数から取得したものと同等のリストを返すことを期待して、COUNT と DISTINCT を使用してさまざまなクエリを試しました。しかし、私が試したものは何もうまくいきませんでした。
そのようなクエリを構築する方法を誰かが提案できますか?