手作業で行う
エラー メッセージが自動的に生成され、メッセージの背後にある例外のリストがそれほど大きくない場合は、各エラー メッセージの種類を通知が必要な人に直接マップするテーブルが必要になる場合があります。
これにより、誰/どのグループがどのタイプのメッセージを受け取るかを正確に追跡し、一部のメッセージが誤って送信されていると判断した場合にメッセージのルーティングを更新することが容易になります。
通常、エラーの種類のごく一部が、エラー レポートの大部分を占めています。たとえば、Microsoft は、クラッシュの 80% がソフトウェアのバグの 20% によって引き起こされていることに気付きました。したがって、役に立つものを得るために、すべてのタイプのエラー メッセージを網羅した完全な表から始める必要さえありません。代わりに、最も一般的なエラーを適切な担当者にマッピングし、それ以外のすべてのエラーを手動でルーティングする担当者にルーティングするだけのリストから始めることができます。エラーが手動でルーティングされるたびに、ルーティング テーブルにエントリを追加して、そのタイプのエラーが今後自動的に処理されるようにすることができます。
ドキュメントの分類
エラーメッセージが送信者によって編集されていて、ルーティング時にこの情報を使用したい場合を除き、これを文書分類タスクとして扱うことはお勧めしません。ただし、これがやりたい場合は、プログラミング言語ごとに整理されたドキュメントドキュメント分類用の適切なパッケージのリストを次に示します。
Python - Python ベースの自然言語ツールキット (NLTK)を使用してこれを行うには、無料で入手できるNLTK ブックのドキュメント分類セクションを参照してください。
Ruby - Ruby の方が好みなら、 Classifier gemを使用できます。これは、Family Guy の引用が面白いかどうかを検出するサンプル コードです。
C# - C# プログラマーはnBayesを使用できます。プロジェクトのホームページには、単純なスパム/非スパム分類器のサンプル コードがあります。
Java -Java関係者には、 Classifier4J、Weka、Lucene Mahout、および adi92 が言及したMalletがあります。
Weka を使用したルールの学習- ルールが必要な場合は、ルール セット ベースの学習者が含まれているため、Weka は特に興味深いものになる可能性があります。Weka を使用したテキストの分類に関するチュートリアルは、こちらにあります。