18

パンダを作成しようとしていますDataFrameが、単一のファイルに対しては正常に機能します。同じデータ構造を持つ複数のファイル用にビルドする必要がある場合。したがって、単一のファイル名の代わりに、作成したいファイル名のリストがありますDataFrame

pandas で current に追加する方法がわからない、DataFrameまたは pandas がファイルのリストをDataFrame.

4

6 に答える 6

36

pandasconcatコマンドは、ここでの友達です。ディレクトリtargetdirにすべてのファイルがあるとしましょう。あなたはできる:

  1. ファイルのリストを作成する
  2. それらをパンダデータフレームとしてロードします
  3. そしてそれらを連結します

`

import os
import pandas as pd

#list the files
filelist = os.listdir(targetdir) 
#read them into pandas
df_list = [pd.read_table(file) for file in filelist]
#concatenate them together
big_df = pd.concat(df_list)
于 2013-01-23T22:58:43.570 に答える
3

潜在的に恐ろしく非効率的ですが...

を使用read_csvして 2 つ (またはそれ以上) のデータフレームを作成してから、 join を使用してそれらをまとめてみませんか?

とはいえ、これまでに使用したデータまたはコードの一部を提供すると、質問に答えやすくなります。

于 2012-05-12T12:35:10.603 に答える
1

パンダにフィードする前に、ファイルを連結しようとするかもしれません。Linux または Mac を使用しているcat場合は、 を使用できます。それ以外の場合は、非常に単純な Python 関数で作業できます。

于 2012-05-11T06:17:58.383 に答える
0

これらのファイルはcsv形式ですか。read_csvを使用できます。 http://pandas.sourceforge.net/io.html

ファイルを読み取って2つのデータフレームに保存したら、2つのデータフレームをマージするか、2つのデータフレームの1つに列を追加します(共通のインデックスを想定)。パンダは不足している行を埋めることができるはずです。

于 2012-05-11T16:55:31.843 に答える
0
import os
import pandas as pd
data = []

thisdir = os.getcwd()

for r, d, f in os.walk(thisdir):
    for file in f:
        if ".docx" in file:
            data.append(file)

df = pd.DataFrame(data)
于 2021-02-04T01:06:16.240 に答える