2

300万のドキュメントをスクレイプする必要があります。それらはすべてtextフィールドvarcharです。サンプルの場合、250のドキュメントをスクレイプしたところ、実行EXEC sp_spaceusedするとデータベースサイズとして26.6MBになりました。これから300万のドキュメントを保存するのに必要なサイズを計算できますか?おおよその値になるオフコース。しかし、問題は、この値に基づいて実際に計算できるかどうかです。

4

3 に答える 3

3

250ドキュメントは、300万ドキュメントの非常に小さなサンプルです。DBに他に何があるかによって、26.6のうちどれだけがドキュメントで構成されているかを判断するのは困難です。

26.6MB / 250 * 3000000〜=319GBは上限削った250が代表的なサンプルであると仮定すると、すべてのドキュメントを含むDBのサイズの高い見積もり。

于 2012-08-18T15:25:44.847 に答える
2

基本的に、サンプルが代表的なものであることが期待される場合は、これを行うことができます。10倍や100倍など、もっとサンプリングできますか?

とにかく、おそらくそのサイズだけが増加するので、作成したテーブルのサイズを考慮する必要があります。

Database size = your tables + system objects + unused space (+ log size).

あなたは「あなたのテーブル」を測定したいだけです。

Enterpriseエディションを使用している場合は、圧縮をオンにしてみてください。ただし、LOB値では機能しません。

于 2012-08-18T15:32:23.850 に答える
0

ログがフラッシュされると仮定すると(たとえば、単純なリカバリモデル、またはクエリの前にバックアップされたDB)、この数値(MB)を取得して12000を掛けることができます。

大きなバイナリドキュメントとテキストを格納するには、FILESTREAM(SQL Server 2008以降)の使用を検討してください。

于 2012-08-18T15:25:52.200 に答える