帰ってきて質問です。自動テキスト分類のために Rapid Miner で遊んでいますが、うまくいきません。「例に例が設定されていません。演算子のパフォーマンスに問題があります」というエラーが表示されます。それが何を指しているのか分かりますか?
3 に答える
RapidMiner では、サンプル セットとして使用する前にコンバータ コンポーネントを使用する必要があります。たとえば、出力が 'doc' である場合、次の入力 'exa' にリンクするには、コンポーネント 'Documents to Data' を使用する必要があります。それで全部です!
RapidMiner のテキスト マイニング プロセスについて詳しく教えてください。文脈がなければ、あなたの質問に答えるのは難しいです。
RapidMiner の詳細については、RapidMiner ユーザー フォーラム ( http://forum.rapid-i.com/ ) を参照してください。
RapidMiner Resources では、RapidMiner を使用したテキスト マイニングの方法に関する RapidMiner のチュートリアル ビデオを見つけることができます: http://rapidminerresources.com/index.php?page=text-mining-3
Rapid-I では、90 分間のテキスト マイニング ウェビナーも提供しています。「サービス」および「トレーニング」の下にある Rapid-I Web ページ、または Web ショップで見つけることができます。
これらのリンクが、RapidMiner による自動テキスト分類の開始に役立つことを願っています。RapidMiner のテキスト マイニング プロセスについて詳しく教えていただければ、ご質問に直接お答えできるかもしれません。
サンプル セットがないと表示されている場合は、元のデータに問題がある可能性があります。プロセスの画像を投稿できますか?
たとえば、最初の入力がオペレーターに接続されていることを確認してください。エラーが発生するのはどの 2 つのオペレーターですか?
1 つの考え: テキスト マイニングで設定される例は通常、ドキュメント コレクションですが、実際にドキュメント (PDF、Word) を使用している場合、形式はドキュメント (Doc) になり、ドキュメントをデータ (ドキュメントからドキュメント) に変換する必要がある場合があります。データ演算子)。次に、Performance オペレーターにフィードできるサンプル セットが必要です。
これが役立つことを願っています-以前のコメントが言ったように、プロセスを知らなければ、エラーがどこにあるのかを正確に知ることは困難です.