ドキュメント指向のデータベースを使用して多数の JSON ドキュメントを保存したいと考えていますが、すべて非常によく似たスキーマ (同一ではありません) を使用します。
文書の一例:
{
"firstName": "John",
"lastName": "Smith",
"age": 25,
}
キー文字列 (「firstName」など) を何度も何度も保存することを避けるために、(何らかの種類の) 圧縮を使用するシステム (CouchDB など) はありますか?
私の動機は、何百万ものドキュメントがある場合、特に繰り返しキーの一部が「firstName」などよりもはるかに長い場合に、ディスク上のデータベースのサイズを最小限に抑えることです。
ご感想ありがとうございます!
W
編集:これについてもっと考えてみると、私が尋ねていると思うのは、圧縮辞書が(部分的に?)ドキュメントストア内の複数の圧縮ドキュメント間で共有されている(そしておそらく上に構築されている)より一般的な圧縮システムの特定のケースです時間)。これにより、JSON キー以外の圧縮も処理されます。
やってみたら面白い!