0

テキストファイルとして保存された電子メールを扱うときに、バッグオブワードアプローチの実装を検討しています。メールに返信が必要であることを示すキーワードを使用し、メールをバイナリ (単語が使用されているかどうかに応じて 1|0|1|0|0 など) で分析し、使用できる特徴ベクトルを取得したいと考えています。さまざまな ML アルゴリズム。

PHP を使用して特徴ベクトルを取得することを考えていましたが、既存の実装が見つかりません。PHPでそのようなことをすることさえ可能ですか?

4

1 に答える 1

1

はい、単語の袋は分類子を作成するのに非常に理にかなっています。私はテキスト分類に関する論文も作成しており、そのためにphpとmysqlを使用しています。バッグオブワードの作成について少し混乱しています。しかし、しばらくするとできるようになります。

于 2013-01-25T09:48:28.163 に答える