1

StackOverflowのオラクルの皆さん、こんにちは。

初めてスタックオーバーフローについて質問したので、お気軽にキャベツを投げてください。(または質問の仕方を修正してください)

私はこの問題を抱えています。私はHDF5を使用して大量のCookie情報を保存しています。

私のデータは次のように構成されています。

CookieID->イベント->Key_valueペア

cookieIDごとに複数のイベントがあります。ただし、イベントごとに1つのkey_valueペアのみ。

これをHDF5に保存する最善の方法を知りたいのですが。

現在、テーブルの名前としてcookieIDを使用して、HDF5のグループ内の個別のテーブルとして各Cookieを保存しています。残念ながら、10,000,000個のCookieがあるため、HDF5(または具体的にはPyTables)はこのタイプのストレージを承認しません。

具体的には、このエラーをスローします。

/ CookieData``が推奨される子の最大数(16384)を超えています

この情報を保存するための最良の方法をお勧めできるかどうか疑問に思います。

フラットテーブルを作成する必要がありますか?この方法を維持する必要がありますか?他にできることはありますか?

ヘルプをいただければ幸いです。読んでくれてありがとう。

4

1 に答える 1

2

数時間後の調査で、私がやろうとしていたことは断固として不可能であることがわかりました。

次のリンクは、可変長のネストされた子でHDF5を使用できないことに関する詳細を示しています。

とりあえずフラットファイルを使うことにしました。これがデータベースストアよりも効率的であることを願っています。最終的にフラットファイルの問題は、ファイル内の値を複製する必要があることです。そうしないと、値が存在しないはずです。

他の誰かがより良いアイデアを持っているなら、それはありがたいです。

于 2012-08-07T13:20:37.943 に答える