記事、ポリシー、法律、およびテキストを含む Web サイトを構築しています。すべてのデータ (場合によっては 8000 文字を超える記事) を MSSql 2008 データベースに保存しています。テキストデータをデータベースに保存すべきではないと言っている記事をいくつか読みました。それらはどこに保管されるべきですか?.txtファイルか何かで?また、データを検索したいと思います。それらがDBに保存されている場合は、ストアドプロシージャなどを使用できます。ドキュメントに保存されている場合は、Luceneなどのツールを使用する必要があります。私は正しいですか?このプロジェクトで DB を使用するという私のアプローチは間違っていますか? 教えてください。
1 に答える
1) 昔ながらのフラット ファイル データベース (txt ドキュメント、大規模なプロジェクトにはお勧めしません) 2) 従来のテキスト保存データベース 3) 文書のデータベース
テキストの DB を使用するかドキュメントの DB を使用するかの議論は、あなたがどのスキル/知識を持っているか、またはアクセス (または支援) を受ける可能性があるかによって異なります。あなたはテキストのDBの方が快適だと思いますが、私の意見では、それは何も悪いことではありません - 最悪のシナリオは、テキストのストレージではなく、ドキュメントを長期的に使用する必要がある場合です。テキストデータベースからドキュメントを自動的に生成できるはずです-逆のことを行うと、もっとトリッキーになると思います(大量の独自ドキュメントをテキストに変換して保存および挿入する)。テキスト データベースからプレーン テキスト ファイルを生成するのは簡単で、ほとんどのベンダー ドキュメント形式は、その後のフォーマットのためにプレーン テキスト ドキュメントのインポートをサポートしています。
このような大規模なプロジェクトの場合、ドキュメントが何のために、誰によって使用される可能性が高いか、どの方法が最も適しているかを検討するために、時間を費やす必要があります。MS Word を頻繁に使用し、データをダウンロードしたい人にデータベースを提供している場合は、おそらくドキュメント DB の使用を検討する必要があります。それが提供したい情報 (および Web ベースのツール) だけである場合は、独自のデータをどのように操作するかを検討する必要があります。
これは明らかにすべての意見ですが、私の最後のアドバイスは、テキストルートをたどる場合は最初からutf-8テキストを使用することを確認することです(苦い経験)。