1

分類の問題があります。この問題を解決するために、ユニグラムやバイグラムなど、さまざまな機能セットを使用する予定です。そして、これらの機能セットのさまざまな組み合わせを試してみたいと思っています。それを行う最良の方法は何ですか?機能セットの組み合わせごとに異なるファイルを準備する必要がありますか?

4

1 に答える 1

1

簡単な方法は、「RemoveByName」フィルターを使用して、正規表現に基づいて属性を除外することです。たとえば、ユニグラム機能名が「uni_」で始まり、バイグラムが「bi_」で始まる場合、RemoveByName -E ^uni_ を使用してバイグラムのみを残すことができます。これは、前処理ステップとして、またはメタ「FilteredClassifier」を使用して、GUI を介して実行できます。

ただし、WEKA 内からさまざまな組み合わせを自動的に試す方法は思いつきません。

于 2013-03-12T11:17:57.167 に答える