ggPlot で視覚化を作成できるように、Pandas dataFrame を作成しようとしています。しかし、DataFrame 構造をセットアップするのに苦労しています。
私のビジュアライゼーションは、(年対合計) の折れ線グラフになります。折れ線グラフは、何年にもわたって複数の「死因」を追跡します。
年ごとにグループ化された CSV ファイルをインポートしてから、'cause_of_death' をインポートしてカウントを行いました。しかし、これは DataFrame ではないため、折れ線グラフを作成するのに適切な形式ではありません。
以下は私のコードです。どんな提案も役に立ちます、ありがとう。
CSV ファイルから取得したいフィールドは「deathYear」と「cause_of_death」です
from pandas import *
from ggplot import *
df = pandas.read_csv('query_result.csv')
newDF = df.loc[:,['date_of_death_year','acme_underlying_cause_code']]
data = DataFrame(newDF.groupby(['date_of_death_year','acme_underlying_cause_code']).size())
print data