Web ページのコンテンツをデータベースに保存してキャッシュするのに、どちらの方法が適しているか知りたいですか?
- ntext データ型を使用し、コンテンツをフラット文字列として保存する
- ntext を使用するが、コンテンツを圧縮してから保存する
- varbinary(MAX) を使用してコンテンツを保存する (フラット文字列をバイナリに変換するにはどうすればよいですか? ;-))
- あなたが私に提案している他のアプローチ
アップデート
より詳細には、多くのテーブル (URL、キャッシュ、ParsedContents、単語、ヒットなど) があり、URL テーブルの各 URL に対して要求を送信し、応答をキャッシュ テーブルに保存します。これは私のエンジンの Downloader (Google の URLResolver) セクションです。次に、インデクサー セクションの行為は、これに関連する解析などのタスクを実行することでした。圧縮/圧縮解除は、新しいコンテンツがキャッシュまたは解析される場合にのみ実行されます