1

私は四半期ごとに継続的な調査を行っています。私たちは人々にサインアップしてもらいます (広範な人口統計情報を提供します)。

次に、非常に悪い、悪い、同じ、より良い、はるかに良い、5 つの可能な値を持つ 6 つの短い質問に答えてもらいます。

もちろん、時間が経つにつれて、同じ参加者を得ることはできなくなります.脱落する人もいれば、新しい人がサインアップする人もいるでしょう.初期の人口統計データによって定義されたさまざまなカテゴリによる継続的な収集と分析を最大限に可能にする..現在、参加者は 700 人ほどなので、データセットはそれほど大きくありません。IE; 人口統計、UID、北、南、住宅。コマーシャル 次に、第 1 四半期の 6 つの質問に回答します。第 2 四半期も同様です。次に、サイコロを切り、さまざまな人口統計による四半期ごとの回答の値を平均して、時間の経過に伴う傾向を確認できる必要があります。

平均化、グループ化などは、四半期ごとに参加者が異なるため、やや複雑です

この種の DB の設計パターンへのポインタはありますか? と分析?これは疎行列ですか?

4

3 に答える 3

2

質問の調査分析部分に関しては、Rの調査パッケージ( 「調査分析の例」などの役立つビネットが多数含まれている) を参照することを強くお勧めします。これについては、Web ページ「R での調査分析」で詳しく読むことができます。特に、非常に大規模な調査データを扱う主題を扱っている、データベースに裏打ちされた調査オブジェクトというタイトルのページをご覧になることをお勧めします。

この分析は、必要に応じて RPy2を使用して Python に統合できます。

于 2010-02-08T22:28:14.033 に答える
1

これはデータ ウェアハウスです。小さいですが、データ ウェアハウスです。

あなたはスタースキーマを持っています。

あなたは事実を持っています:

  • 応答値は尺度です

次元があります:

  • 期間。これには多くの属性 (年、四半期、月、日、週など) があります。このディメンションを使用すると、調査に対する無制限の回答を蓄積できます。

  • 質問。これにはいくつかの属性があります。通常、質問はカテゴリ、製品ライン、フォーカス、またはその他のものに属します。このディメンションには、多数の質問「カテゴリ」列を含めることができます。

  • 参加者。各参加者には、固有の属性と人口統計カテゴリへの参照があります。人口統計カテゴリは、非常に簡単に、人口統計の組み合わせを列挙できます。このディメンションを使用すると、回答者またはその人口統計カテゴリを経時的に追跡できます。

しかし、Ralph Kimball の The Data Warehouse Toolkit を使用して、それらの設計パターンに従ってください。 http://www.amazon.com/Data-Warehouse-Toolkit-Complete-Dimensional/dp/0471200247
本を購入してください。間違った道に進む前に、すべてを完全に理解することが絶対に不可欠です。

また、データ ウェアハウジングを行っているためです。Stack Overflow の [Data Warehousing] に関するすべての質問をご覧ください。見つけることができるすべてのデータ ウェアハウジングのブログをお読みください。

関連するデザイン パターンは 1 つだけです。スター スキーマです。それが分かれば、すべてわかります。

于 2010-02-08T18:16:36.660 に答える
0

分析において、6 つの質問が、回答が相関していると思わせるような形で提示された場合は、生のスコアに対して因子分析を行うことを最初に検討してください。多くの場合、地域や顧客タイプをまたがって要因を比較すると、複数の質問を単独で比較するよりも統計的検出力が高くなります。また、因子スコアは正規分布している可能性が高く (これらは 6 つの観測値の加重合計です)、6 つの質問だけではそうではありません。これにより、因子スコアを比較するときに、正規分布に基づいて t 検定を適用できます。

ただし、注意点が 1 つあります。回答に数値を割り当てる場合 - 1 = かなり悪い、2 = 悪い、など。非常に悪いものと悪いものの間の距離が、悪いものと同じものの間の距離と同じであることを暗示しています。これは一般的に真実ではありません.「もっと悪い」の投票を得るには本当に失敗する必要があるかもしれません. したがって、基数 (数値) の序数 (順序付け) への割り当てには、独自のバイアスがあります。

四半期ごとの参加者数の不均等は問題ではありません。不均等なサンプル サイズを扱う統計的 t 検定があります。

于 2010-02-08T18:56:57.863 に答える