Windows を使用している場合は、Log Parserを参照してください。スタンドアロンのダウンロードとして入手でき、 IIS リソース キットの一部としても含まれています。
Log Parser は、ログを読み取り、データベースにアップロードできます。
データベースに関する考慮事項:
データベース サーバーには、高速なもの (Microsoft SQL Server、IBM の DB2、PostgreSQL、または Oracle) が必要です。mySQL も役立つかもしれませんが、大規模なデータベースを使用した経験はありません。
余裕のあるすべてのメモリが必要になります。データベースを定期的に使用する場合は、少なくとも 4 GB だと思います。より少ない量で実行できますが、パフォーマンスに大きな違いがあることに気付くでしょう.
また、余裕がある場合はマルチコア/マルチ CPU サーバーを選択し、このデータベースを定期的に使用する場合も同様です。
もう 1 つの推奨事項は、実行するクエリの王様を分析し、それに応じてインデックスを計画することです。注意: インデックスを作成するたびに、追加のストレージ領域が必要になります。
もちろん、大量のデータをロードする前に、インデックス作成をオフにするか、インデックスを破棄してください。これにより、ロードが大幅に高速化されます。データ ロード操作の後で、インデックスを再作成するか、インデックスを再作成します。
ここで、このデータベースが進行中の操作である場合 (つまり、何かを調査/分析して破棄するだけではない場合)、カタログおよび詳細テーブルを使用してデータベース スキーマを設計することができます。これはデータベースの正規化と呼ばれ、必要な正規化の正確な量は使用パターン (データ ロード操作とクエリ操作) によって異なります。このデータベースが継続的に使用され、パフォーマンス要件がある場合は、経験豊富な DBA が必要です。
PS
ここに明らかなことを含めるリスクを冒しますが...
Log Analyzerに興味があるかもしれません。これらは、Web サーバーのログ ファイルから統計情報を生成するコンピューター プログラムです (ftp、sftp、およびメール サーバーのログ ファイルも分析できるものもあります)。
Web ログ アナライザーは、統計を含むレポートを生成します。通常、レポートは HTML ファイルとして生成され、グラフィックが含まれます。深度分析とオプションにはかなりの種類があります。非常にカスタマイズ可能なものもあれば、そうでないものもあります。商用製品とオープン ソースの両方が見つかります。
管理するデータの量については、各候補製品を再確認し、処理速度と処理能力を詳しく調べてください。