0

いくつかのコンテキストを提供する: アプリケーションの問題は Excel シートに記録され、そのシートの列の 1 つには、ユーザー (問題を提起した) と解決チーム メンバーの間の電子メール通信が含まれています。他の有用な情報を含む他の列がたくさんあります。私の仕事は、このデータからビジネスに役立つ洞察を見つけることです。

  1. それがどのタイプの問題だったかを調べますか?たとえば、ユーザーのトレーニングの問題やアクセスの問題などです。これは、メールのテキストを分析し、何らかの方法で問題の種類を把握することを意味します。
  2. 1 つの問題について、何件の電子メールでの会話が行われましたか?
  3. 繰り返しの問題ですか?
  4. 他にも簡単な統計問題があります。

Python を使用した NLP が私の問題を解決できることを読みました。同じことをRapidminerも調べました。

今私の質問はです。「私は正しい方向に進んでいますか?, NLP (自然言語処理) はこれらの問題の解決策ですか?」b. はいの場合、どのように開始すればよいでしょうか.. Python を使用した NLP に関する本を読み始めましたが、それは膨大です。集中して分析を開始できる特定の分野はありますか? c. Rapidminer ツールはどうですか? これらすべての質問に答えることはできますか? データ量はそれほど大きくありません(100000行かもしれません)... Rapidminerでプロセスを構築するのは非常に簡単に見えるので、それを開始しました...

提案をいただければ幸いです!!!

4

1 に答える 1

0

xlrd Python モジュールを試して、Excel シートを読み取って処理します。このモジュールを使用した適切な実装は、問題を解決する簡単な方法だと思います。

于 2013-09-20T06:52:16.013 に答える