RapidMiner 5.3.013 を使用しています。Remedy の数千行の作業ログを含む Excel ファイルから読み取っています。正規表現に基づいてテキストを削除し、^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:
Process Documents from Data を使用したいと考えています。これまでのところ、これを行う方法がわかりません。おそらくVBAを書くこともできますが、Rapidminerでそれを行う方法を知りたい.
質問する
703 次
1 に答える
0
Excel データを読み取った後、Process Documents オペレーターによって処理されるフィールドがテキストを入力するように設定されていることを確認します。これは、Nominal to Text 演算子を使用して行います。プロセス ドキュメント ループ内で、Tokenize オペレーターを使用してデータをトークンに分割します。Filter Tokens オペレーターを使用して、不要なトークンを削除します。この演算子は、正規表現をパラメーターとして受け取ります。不要なトークンを保持するのではなく削除するには、この演算子に反転フラグが設定されていることを確認してください。
于 2013-09-25T19:44:48.517 に答える