4

PyTables を使用して、いくつかの画像をArrayデータCArray型として保存しています。これらの画像ごとに、いくつかの基本的なメタデータ ( EXIFデータなど) も保存したいと考えています。

AttributeSetこれらのデータ形式の両方を格納するには、メタデータをクラスごとに格納する方法から、すべてのメタデータにArrayCArray使用する方法まで、さまざまな方法があると想像できます。Table

私の質問は次のとおりです。処理のために究極の hdf5 ファイルから画像を効率的にクエリおよび抽出できるようにしたい場合、最良のアプローチは何ですか? たとえば、特定の時間 (午後 12 時から午後 3 時) に撮影された画像を抽出し、そのデータのサブセットを処理して、コピーをデータベースに挿入するか、既存の配列を置き換えられるようにしたいと考えています。

助けてくれてありがとう。

一番、

ニック

[編集 (明確化): 現在、これらの画像を NumPy 配列として処理しており、その機能を保持したいと考えています]

4

1 に答える 1

1

PyTables ドキュメントの私の理解は、次のことを示唆しています。

テーブルを作成します。関心のあるメタデータごとに 1 つの列を作成します。イメージが同じサイズで、テーブルの作成時にわかっている場合は、配列の列を作成してそこに保存します。画像サイズが異なる場合は、画像ごとに一意の識別子 (ファイル名と同等の機能) を持つ列を作成し、新しいグループを作成して、画像ごとに 1 つの配列/キャリーを作成し、前述の表のリストと同じ名前を付けます。

もう1つのオプションは、軽量のRDMS(sqliteでも)を使用してテーブルを保存することでした。これにより、クエリ/ソートなどが簡単になりますが、実際の画像配列はh5ファイルに保持されます。

于 2012-07-30T03:32:24.917 に答える