0

numpy の常連ユーザーである私は、Pandas の構文と概念に惚れ込み、非常に堅牢でパフォーマンス指向の PyTables について読み始めました。

私の主な疑問は次のとおりです。

  • Pandas + PyTables で構成された自家製のフレームワークを使用する場合、データ処理パイプライン (データのインポート、変換、分析、保存、取得) のどのレイヤーをそれぞれに委任する必要がありますか?
  • Pandas の生まれ持った才能とは? PyTables の生まれつきの才能とどのように関連しているか、そしてそれらの才能がどのように関連しているか?
  • それらは直交/補完的/独立していますか、それとも何らかの形で機能が重複していますか?
  • それらはどのように互いに区別されますか?

光をありがとう!

4

1 に答える 1

2

pandas と pytables の間にはあまり重複はありませんが、互いに非常に優れた補完関係にあります。PyTables は保存と取得に関するものですが、pandas は取得後および保存前のデータの操作に関するものです。Pandas には PyTables (pandas.io.pytables.HDFStore を確認してください) への便利なインターフェイスがあるため、pytables を使用して pandas Series/DataFrame を簡単に保存できます。

于 2012-09-17T02:45:53.897 に答える