0

私は象使いの単純ベイズ分類器を訓練しています。私のトレーニングデータには次のような性質があります。

 Sports --> "text from different languages but related to sports"
 Health --> "text from different languages but related to health"

この場合、mahoutは英語以外のデータをサポートしますか?または他の言語のテキストは無視されます。

4

1 に答える 1

2

はいといいえ。分類子は任意の文字列を喜んで操作し、それらに意味を割り当てません。言語は関係ありません。ただし、「スポーツ」と「デポート」が異なる言語で同じ単語であることを理解することはできません。

于 2013-03-21T10:02:44.050 に答える