8

Web データを取得して解析し、出力を Pandas DataFrame として HDF5 ファイルに保存しています。を H5 ファイルに書き込む直前にDataFrame、独自の説明文字列を追加して、データの取得元と解析中に問題が発生したかどうかに関するメタデータに注釈を付けます。

In [1]: my_data_frame.desc = "Some string about the data"

In [2]: my_data_frame.desc

Out[1]: "Some string about the data"

In [3]: print type(my_data_frame)
<class 'pandas.core.frame.DataFrame'>

しかし、同じデータを でロードした後pandas.io.pytables.HDFStore()、追加したdesc属性が見つからず、エラーが表示AttributeError: 'DataFrame' object has no attribute 'desc'されます: この新しい属性を追加したことがないかのように。

メタデータの説明を DataFrame オブジェクトの追加属性として永続化するにはどうすればよいですか? (または、メタデータの目的でハイジャックできる DataFrame の既存の認識された属性はありますか?)

4

1 に答える 1

5

DataFrame メタデータまたは列ごとのメタデータの追加はロードマップにありますが、まだ実装されていません。ただし、API がどのように見えるべきかについてのアイデアにはオープンです。

于 2012-07-26T15:28:46.987 に答える