StackOverflowのオラクルの皆さん、こんにちは。
初めてスタックオーバーフローについて質問したので、お気軽にキャベツを投げてください。(または質問の仕方を修正してください)
私はこの問題を抱えています。私はHDF5を使用して大量のCookie情報を保存しています。
私のデータは次のように構成されています。
CookieID->イベント->Key_valueペア
cookieIDごとに複数のイベントがあります。ただし、イベントごとに1つのkey_valueペアのみ。
これをHDF5に保存する最善の方法を知りたいのですが。
現在、テーブルの名前としてcookieIDを使用して、HDF5のグループ内の個別のテーブルとして各Cookieを保存しています。残念ながら、10,000,000個のCookieがあるため、HDF5(または具体的にはPyTables)はこのタイプのストレージを承認しません。
具体的には、このエラーをスローします。
/ CookieData``が推奨される子の最大数(16384)を超えています
この情報を保存するための最良の方法をお勧めできるかどうか疑問に思います。
フラットテーブルを作成する必要がありますか?この方法を維持する必要がありますか?他にできることはありますか?
ヘルプをいただければ幸いです。読んでくれてありがとう。