0

私は、DataFrame を含む多くのテスト (ノーズ ベース) を作成しています。これらのテストは、エンド ユーザーが読めるようにする必要があります。DataFrame コンストラクターは、プレーン テキストのテーブル表現に比べて読みやすくありません。

reStructured のようなテキスト表現を使用して DataFrame を構築/アサートするのはどうですか?

=========== =========== ========= ========= ========================
id1         id2         net       nnet      desc
(int64)     (int64)     (float64) (float64) (object)
----------- ----------- --------- --------- ------------------------
1001        1002             10.0       0.0 Closed part of queue
1002                          0.0       3.0 Opened part of queue
=========== =========== ========= ========= ========================

(dtype) 行は、アサート時に失敗しないように列の型を強制するのに役立ちます (オプションの場合もあります)。

この reST DataFrame コンストラクト/アサート機能をコーディングする前に、コミュニティからのフィードバックが必要です。また、ipython ノートブックをテスト ケースとして使用することも考えています。

読みやすさが重要な場合、どの DataFrame 表現を優先しますか?

4

1 に答える 1

1

reST テーブルから構築することはできませんが、興味深いでしょう。read_csv を使用して、テーブルを読み取ることができます。read_clipboard および read_fwf (固定幅) も参照してください。

In [22]: table = """\
   ....: id1         id2         net       nnet       desc
   ....: 1001        1002             10.0       0.0  Closed part of queue
   ....: 1002        NaN               0.0       3.0  Opened part of queue
   ....: """

In [23]: df = pandas.read_csv(StringIO(table), sep='[\s]{2,}')

In [24]: df
Out[24]: 
    id1   id2  net  nnet                  desc
0  1001  1002   10     0  Closed part of queue
1  1002   NaN    0     3  Opened part of queue
于 2012-09-14T11:27:40.347 に答える