sharepoint - 8000万のTiffファイルのドキュメント管理ソリューション

Question

8000万のtiffファイル（それぞれ1000 KB）をホストする必要があります。約10テラバイトの場所で、最高のドキュメント管理ソリューションになります。これらのファイルはファイルシステム上にある必要がありますが、ドキュメント管理システム（Sharepoint、Documentum、Filenetなど）を介してインデックスを作成する必要があります。すでにCSV形式のインデックスがあり、8000万個のファイルをクロールしてインデックスを再作成する代わりに、それらのインデックスを再利用したいと考えています。

score 1 · Accepted Answer

SharePoint 2010 は、そのような大規模なドキュメントライブラリを処理できます。これは、WSS3/MOSS2007 エディションで、慎重に計画および設計することで実行できます。

私は Documentum にはあまり詳しくありませんが、SharePoint の世界では、CSV のフィールドを SharePoint のフィールドにマップするカスタムコンテンツタイプを作成し、新しいドキュメントライブラリを使用して 1 つ (または複数、分割することは理にかなっています) のドキュメントライブラリをプロビジョニングします。タイプ。それだけのデータがあれば、複数のサイトコレクションに分割するか、Remote Blob Storage API を確認することを真剣に検討します: http://technet.microsoft.com/en-us/magazine/2009.06.insidesharepoint.aspx

score 0 · Accepted Answer

インデックスをSQLServerなどのデータベースに転送し、ファイルをファイルシステムに保持するのが最善だと思います。DMS（ファイルのアップロード/アクセスなど）は、これらのインデックスに基づいて構築できます。

score -2 · Accepted Answer

Hadoop のようなものを見ていただろう。Amazon Elastic Compute Cloud (EC2) および Amazon Simple Storage Service (S3) で Hadoop を実行することが可能です]。The New York Times が 100 の Amazon EC2 インスタンスと Hadoop アプリケーションを使用して、4 TB の生の画像 TIFF データ (S3 に保存) を処理し、24 時間で 1,100 万の完成した PDF を作成した例を参照して、Hadoopを見てください。約 240 ドルの計算コスト (帯域幅を含まない) [14]。

sharepoint - 8000万のTiffファイルのドキュメント管理ソリューション

3 に答える 3

Related

Reference