0

次のように作成された年間業界売上データのテーブル (必須フィールド) に、年間成長率を追加したいと考えています。

CREATE  TABLE IF NOT EXISTS MarketSizes (
  marketSizeID INT PRIMARY KEY AUTO_INCREMENT ,
  industry INT NOT NULL,
  year INT NOT NULL,
  countryID INT NOT NULL REFERENCES Countries (countryID),
  annualSales DEC(20,2) NULL,
  growthRate DEC(5,2) NULL) 

約 25 年間、100 以上の国、5000 以上の業界の年間データが与えられた場合、growthRate 列に入力/更新する最も効率的な方法は何ですか? インデックスを作成する最も効果的な方法は (業界、年、国 ID) ですか? 御時間ありがとうございます!

4

2 に答える 2

1

免責事項:これはテストされておらず、好奇心といくつかの遊びに端を発しています。「より安全な」ルートに進む代わりに使用する場合は、ご自身で判断してください。コメントは大歓迎です。誰かがもう少し遊んでみたい場合は、私が使用したsqlfiddleを次に示します。残りは頭から離れていましたが、夜遅くなので、間違いに反対票を投じないでください。

さて、好奇心から、更新をスピードアップする(ハックな)方法を見つけたと思います。この小さなテストを除いて、私はそれをテストしていません:

    create table foo(id int, newid int);
    insert into foo (id) values (1), (2), (3);

    update foo, (select @prev:=0) vars
    set foo.newid = @prev,
    foo.id = if(@prev := id, id, id);

    select * from foo

    | ID | NEWID |
    --------------
    |  1 |     0 |
    |  2 |     1 |
    |  3 |     2 |

しかし、前の行からの情報が必要な select ステートメントで素晴らしい経験をしました。ユーザー変数を使用することで、(選択で) 自己結合テーブルを使用する必要がなくなります。読み込んでいるテーブルを同時に更新することはできないため、ダミーのテーブルが必要になります。私がこの回答を作成した理由をいくつか述べておきます。だからここにあります:

あなたの更新ステートメントは

SET @prev = 1; /*this is the value the row should have which has no previous year (or if countryID or industry changed)*/
SET @prevCountry = (SELECT countryID FROM MarketSizes ORDER BY `year`, countryID, industry, marketSizeID LIMIT 1);
SET @prevIndustry = (SELECT industry FROM MarketSizes ORDER BY `year`, countryID, industry, marketSizeID LIMIT 1);

/*also it's important to initialize the variable before-hand, not on the fly like in the example above. Otherwise MySQL complains about a syntax error, because it doesn't support an ORDER BY clause in a multi-table update statement. ORDER BY will be important in the statement!*/

UPDATE MarketSizes
SET growthRate = (annualSales - @prev) / @prev, /*here @prev holds the value of the previous row*/

/*and here come's your "where" clause. If country or industry change reset previousYear value to 1*/
marketSizeID = IF(@prevCountry != countryID OR @prevIndustry != industry, IF(@prev := 1, marketSizeID, marketSizeID), IF(@prev := 1, marketSizeID, marketSizeID)), /*why the convoluted IF()s? see explanation below, things got a bit messed up*/
marketSizeID = IF(@prev := annualSales, marketSizeID , marketSizeID), /*here the value of the current row gets assigned to @prev*/

/*Why the update on marketSizeID? And the IF(this,then,else)? That's the trick. Every other way to assign a new value to our variable @prev results in a syntax error. I just chose the primary key, because it's there. Actually it doesn't matter which column is used here and it might be another performance boost to choose a column which has no index on it (primary key has of course).*/

marketSizeID = IF(@prevCountry := countryID, marketSizeID, marketSizeID),
marketSizeID = IF(@prevIndustry := industry, marketSizeID, marketSizeID)

ORDER BY `year`, countryID, industry, marketSizeID;
于 2013-06-27T00:21:38.957 に答える
1

VIEW だけで growthRate を使用することを検討してください。

CREATE VIEW growthRate AS
SELECT
m1.*,
(m1.annualSales - m2.annualSales) / m2.annualSales AS growthRate
FROM
MarketSizes m1
LEFT JOIN MarketSizes m2 ON m1.industry = m2.industry 
                         AND m1.countryID = m2.countryID 
                         AND m2.year = m1.year - 1

(industry, countryID) と year のインデックスを作成すると、十分なパフォーマンスが得られるはずです。

于 2013-06-27T08:44:36.653 に答える