1

トピック調査と図表にいくつかの宿題があります。データの構造は時々変化するため、最初のタスクは調査の入力を正規化することです。したがって、調査には3つのタイプがあります。

  • テキストが保存される静的フィールド
  • ユーザーが1つのオプションを選択できる動的なもの
  • および複数選択フィールド。ユーザーは複数のオプションを選択できます。

ですから、私は実際には統計学者ではないので、その入ってくるデータで何ができるのか本当にわかりません。

したがって、私が持っているデータはそこから巨大なXMLファイルに保存され、調査が入力された回数とフィールドが入力された回数を簡単に取得できるので、(たとえば、円グラフで入力の関係を示すことができます)または満たされていない)。2つ目のアイデアは、棒グラフなどを使用して、マルチオプション要素のコンテンツ間の関係を示すことです。

マルチオプション要素の場合、1つのオプションの意味でデータを表示するというアイデアがあります。しかし、問題は、何を表示できるかということです。

もう1つの問題は、静的要素(テキストフィールドなど)です。単一のフィールドからどのようなデータを表すことができますか?

XMLフィールドのデータは2001年から2005年まで収集されているので、調査の日付で作業できるかもしれませんが、私が言ったように、データを処理し、可能な限り収集し、作成する方法がわかりません。本当に大量の図。

4

2 に答える 2

0

円グラフはお勧めしません。代わりに、棒グラフまたはドット プロットを使用してください。それらの異なるカテゴリの同様の頻度を区別する方がはるかに簡単です。カテゴリを頻度順に並べることも、ほとんどの場合良い考えです。ここでは、なぜ円グラフが悪いのかについての短い記事を見つけることができます。

3D ダイアグラムは見栄えがよく、データの視覚化に関する知識がほとんどない人々に感銘を与えるための巧妙な方法です (これは必要なものかもしれません ;-) )。しかし、絶対に必要ではない余分なディメンションを使用すると、読者が実際のデータから注意をそらされるため、ほとんどの専門家はそれらを悪い習慣と見なしています。

個人的には、クロステーブルと散布図は、データの 2 つの次元間の関係を表示するためのわかりやすい方法だと思います。

いくつかの基本的な統計を図とともに報告することはしばしば良い考えですが、これは適切な場合にのみ行うようにしてください。どの単変量統計 (平均など) がどのデータに適しているかを知りたい場合は、このウィキペディアの記事を参照してください。

データ ビジュアライゼーションについて真剣に学びたい場合は、このトピックに関するEdward Tufte の本を強くお勧めします。読んでいて本当に楽しいです。それらは確かな科学的根拠に基づいていますが、その分野のバックグラウンドがほとんどまたはまったくない場合でも理解しやすいものです。

がんばれ、アレックス

于 2011-01-09T18:34:32.930 に答える
0

データを正規化した後 (これは、ジョブの視覚化部分よりも難しい場合があります)、次の操作を行う場合があります。

  • テキストを含む静的フィールドを表示するには、これらのテキストを、より少ないカテゴリを含む新しい変数に再コード化して、グラフ/プロットに適合させることができます。もう 1 つの方法は、 wordle.netのように、テキストのワード クラウドを作成することです。
  • それぞれが 1 つの回答のみを含む動的フィールドは、最も簡単に表示できます。属性のパーセンテージを示す円グラフを作成するか、パーセンテージ/密度または頻度も表示できる棒グラフを作成できます (たとえば、R のggplot2パッケージを参照してください)。
  • 複数選択フィールドを表示するには、日付を適切な形式に再構成する必要があります (現在どのように表示されるかはわかりません)。これは、すべての変数のすべてのカテゴリのカウント (頻度) を示すさまざまなテーブルで行うことができます。例: 昨日、187 人がチョコレートを食べ、160 人がパンを食べ、50 人がピザを食べました。その後、棒グラフで値を簡単に表示できます。誰でも複数の値を選択できるため、これらの値の合計はサンプル サイズと等しくないことに注意してください。そのため、円グラフは非常に悪い選択です。

お役に立てれば幸いです。

于 2011-01-08T20:39:18.263 に答える