3

毎月約 10000 ページの印刷ページを生成するアプリケーションがあります。各レポート (約 2000/月) は、単純なネットワーク ファイル共有に PDF としてアーカイブされます。次の要件を満たす文書管理システムを探しています。

  • アーカイブ フォルダを監視し、定期的に、または変更が検出されたときにインデックスを更新します
  • ユーザーがファイル名、タイムスパン、およびその他の関連ファイル属性に基づいてドキュメントを検索できるイントラネット Web ページを提供する
  • 全文検索
  • 大規模な/大幅に増加するアーカイブを処理できます

明確にするために、私はここで構築済みのソリューションを探しています。商用製品は受け入れられます。

4

5 に答える 5

1

Ploneは、あなたのニーズに十分に対応できます。PDF コンテンツをインデックス化するためのプラグインがあり、メタデータをカスタマイズできます。また、組み込みの検索機能を備えた素晴らしい Web インターフェイスを備えています。最良の部分は、無料で使いやすいことです。また、ニーズが大きくなった場合は、有料でサポートを受けることができます。

私の唯一の推奨事項 (一見) は、Zope OO データベースではなく、ファイル システムにコンテンツを保存することです。メタデータとインデックス データのみをデータベースに保存する必要があります。これは、ドキュメント管理の世界で大量のコンテンツを格納するための非常に一般的な方法です。

それが役立つことを願っています!

トム・パール

于 2009-10-24T19:19:14.490 に答える
1

これは非常に漠然とした質問であり、どのように答えればよいかわかりません。

すべてのファイルにインデックスを付け、データベース内の情報が最新の状態に保たれるようにする方法が必要なようです。私が提案できるのは、次のような検索サーバーを調べることです。

スフィンクス

ソル

これらはどちらもセットアップが必要ですが、すべての要件を処理します。フォルダーを監視してインデックスを最新の状態に保つように簡単にセットアップでき、優れた全文検索を提供し、検索するページをセットアップするとイントラネット Web ページからアクセスできます。これらは大規模な操作に使用されるため、大規模なアーカイブは問題になりません。

事前に構築されたソリューションを探している場合、何を言及すればよいかわかりません。

于 2009-10-24T12:18:53.813 に答える
1

Google ドキュメントをお勧めします。私の知る限り、すべての要件を処理できます。

于 2009-10-24T12:14:28.660 に答える
0

トムが言ったように、Plone はあなたが説明することを行います。pdfs がパスにあるコマンドライン プログラム pdftotext に依存する全文検索が組み込まれています。あなたが私に興味を持っているかもしれないいくつかの拡張機能があります:

  • Reflecto - ファイルシステムの一部を監視し、Plone 内で検索して表示することができます:
    plone.org/products のreflecto を参照してください。
  • TextIndexNG 3 - 出版社向けに書かれた索引付け拡張機能
    http://www.zopyx.com/projects/TextIndexNG3/textindexng3-the-leading-fulltext-indexing/
    または
    collective.solr - 検索エンジン「solr」を使用してカタログを操作します:
    plone.org/products の collective.solr を参照してください。

(申し訳ありませんが、stackoverflows の新しいユーザー ポリシーによりリンクが失われています)

于 2009-10-31T14:25:56.787 に答える