2

ニューラル ネットワークをトレーニングして、いくつかのテキスト ドキュメントをブール クラスに分類する必要があります (NN には、「はい」または「いいえ」の値を持つ 1 つの出力があります)。
最適な入力パラメータを見つけるアルゴリズムはありますか (たとえば、単語の存在、用語、文、および/または単語の頻度/繰り返し & ...) はありますか?
そうでない場合は、これらのパラメーターを見つけるための出発点を教えてもらえますか (どのように選択すればよいですか)?

ありがとう

4

1 に答える 1

1

私が知っている標準的なアプローチは、単語/用語のベクトルを使用し、学習または統計アルゴリズムを使用して負または正のスコアを割り当てることです。パーセプトロン学習でも十分なはずです。正例と負例の適切なセットが必要なだけです。

私の知る限り、これはすべてのスパムフィルターの仕組みです。そして、それらはかなりうまく機能します。

于 2012-01-05T09:10:44.147 に答える