1

4 年以上の通信を含む一連の大規模な個々の .pst ファイルに対してテキスト マイニングを実行することを検討しています。

最初は、ヘッダー情報を抽出してソーシャル ネットワークを識別したいと考えていますが、最終的には、キーワードに基づいて電子メールを分類するか、さらなる分析をサポートする構造化された出力を作成したいと考えています。

どこから始めればよいか、誰か提案はありますか?

4

1 に答える 1

2

公開されているEnron Email Datasetで行われた調査を確認する必要があります-> ページには興味深い論文へのリンクがあります

于 2011-03-09T12:59:18.343 に答える