0

次の Python の pandas パッケージの例では、2 つのデータフレームを重複/共通のインデックスでマージすると、これらのインデックスは http://pandas.pydata.org/pandas-docs/dev/10min.html#joinになります。

代わりに次のようにマージすることは可能ですか:

     key  lval    rval
  0  foo     1,2     4,5

1,2,4,5が文字列の場合、違いはありますか?

4

1 に答える 1

2

このデータ構造の使用はお勧めしません。分析の次の段階に応じて、より良い方法があると思います...

とは言っても、やり方は一つ。キーごとに一連のリストを取得します。

In [11]: l = left.groupby('key')['lval'].apply(list)

In [12]: l.name = 'lval'

In [13]: l
Out[13]:
key
foo    [1, 2]
Name: lval, dtype: object

In [14]: r = right.groupby('key')['rval'].apply(list)

In [15]: r.name = 'rval'

そして、これらを DataFrame に連結します。

In [16]: pd.concat([l, r], axis=1)
Out[16]:
       lval    rval
key
foo  [1, 2]  [4, 5]
于 2013-09-22T04:06:08.947 に答える