私はMongo GridFSを使用しており、かなり大きなMongoデータベースを使用しており、db.stats()
コマンドを使用すると、現在dataSizeは89GBです。
mongo ダンプを作成すると、ファイル システムのディレクトリ サイズは 86 GB になり、データベースを別のマシンに復元して実行するdb.stats()
と、122 GB になります。
ダンプ/復元後に dataSize が 33GB 増加する理由を知っている人はいますか?
編集 これが初期データベースの統計です
MongoDB shell version: 2.4.5
connecting to: imgdb
rs0:PRIMARY> db.stats();
{
"db" : "imgdb",
"collections" : 4,
"objects" : 2549884,
"avgObjSize" : 37802.88397276111,
"dataSize" : 96392968996,
"storageSize" : 363433842080,
"numExtents" : 207,
"indexes" : 4,
"indexSize" : 307245904,
"fileSize" : 366974337024,
"nsSizeMB" : 16,
"dataFileVersion" : {
"major" : 4,
"minor" : 5
},
"ok" : 1
}
そして、ここに復元されたデータベースからの統計があります
MongoDB shell version: 2.6.4
connecting to: imgdb
dbdb.stats();
{
"db" : "imgdb",
"collections" : 4,
"objects" : 2549924,
"avgObjSize" : 51781.40103312883,
"dataSize" : 132038637248,
"storageSize" : 132281756768,
"numExtents" : 98,
"indexes" : 4,
"indexSize" : 199976784,
"fileSize" : 135159349248,
"nsSizeMB" : 16,
"dataFileVersion" : {
"major" : 4,
"minor" : 5
},
"extentFreeList" : {
"num" : 0,
"totalSize" : 0
},
"ok" : 1
}
考えられる原因のいくつかの考えを次に示します。
- どういうわけか、復元されたバージョンにはさらに 40 個のオブジェクトがあります。
- 異なる mongo バージョンは、インデックス作成アルゴリズムがどのように変更されたかの原因である可能性がありますか?
- 初期データベースはレプリカセットにありました
- 最初のデータベースは 320 GB でしたが、すべての画像を圧縮して、しばらく前に 75 GB に減らしました。そのため、初期データベースのストレージ サイズが大幅に大きくなっています