次の Python の pandas パッケージの例では、2 つのデータフレームを重複/共通のインデックスでマージすると、これらのインデックスは http://pandas.pydata.org/pandas-docs/dev/10min.html#joinになります。
代わりに次のようにマージすることは可能ですか:
key lval rval
0 foo 1,2 4,5
1,2,4,5が文字列の場合、違いはありますか?
次の Python の pandas パッケージの例では、2 つのデータフレームを重複/共通のインデックスでマージすると、これらのインデックスは http://pandas.pydata.org/pandas-docs/dev/10min.html#joinになります。
代わりに次のようにマージすることは可能ですか:
key lval rval
0 foo 1,2 4,5
1,2,4,5が文字列の場合、違いはありますか?
このデータ構造の使用はお勧めしません。分析の次の段階に応じて、より良い方法があると思います...
とは言っても、やり方は一つ。キーごとに一連のリストを取得します。
In [11]: l = left.groupby('key')['lval'].apply(list)
In [12]: l.name = 'lval'
In [13]: l
Out[13]:
key
foo [1, 2]
Name: lval, dtype: object
In [14]: r = right.groupby('key')['rval'].apply(list)
In [15]: r.name = 'rval'
そして、これらを DataFrame に連結します。
In [16]: pd.concat([l, r], axis=1)
Out[16]:
lval rval
key
foo [1, 2] [4, 5]