どちらも非常に似ているように見えますが、どちらのパッケージが財務データ分析にとってより有益であるかについて興味があります.
3 に答える
pandas は、NumPy の上に構築された高レベルのデータ操作ツールを提供します。NumPy 自体は、MATLAB に似たかなり低レベルのツールです。一方、pandas は、豊富な時系列機能、データ アライメント、NA に適した統計、groupby、マージおよび結合メソッド、およびその他の多くの便利な機能を提供します。近年、金融アプリケーションで非常に人気があります。近刊予定の本では、pandas を使用した財務データ分析に特化した章を用意する予定です。
Numpyは、パンダ(およびPython用の事実上すべての数値ツール)に必要です。Scipyはパンダに厳密に必須ではありませんが、「オプションの依存関係」としてリストされています。パンダがNumpyやScipyの代わりになるとは言えません。むしろ、Pythonで数値データと表形式データをより合理的に処理する方法を提供する追加のツールです。パンダのデータ構造を使用できますが、Numpy関数とScipy関数を自由に利用して操作できます。
Pandas は、ビニング ( Python の pandas でデータフレームをビニング) を簡単にし、統計を計算できるため、テーブルを操作する優れた方法を提供します。パンダで優れているもう 1 つの点は、さまざまなプロパティを持つ一連のレイヤーを結合し、groupby 関数を使用して結合できる Panel クラスです。