pyTablesが提供するものと同様に、Scala で少し支援を探しています。PyTables は、階層的なデータセットを管理するためのパッケージであり、非常に大量のデータを効率的かつ簡単に処理できるように設計されています。
助言がありますか?
私は pyTables をざっと見てみましたが、Scalaland (または実際には Javaland) に似たようなものはほとんどないと思いますが、時間を投資したい場合は、それを可能にするために必要な要素がいくつかあります。
PyTables は HDF5 の python 実装であり、pythonic の方法で作業し、適切なインデックス作成サポートを取得できるようにするためのいくつかの機能が追加されています。Scala で同様の方法で実装されたパッケージがあるかどうかはわかりませんが、Java での HDF5 実装を使用して、同じ HFD5 ベースの階層データ ストレージを使用できます: HDF Java