3

さまざまな機械学習アルゴリズムの自社開発プラットフォームを C# から R などのより堅牢なデータ マイニング プラットフォームに移植することを検討しています。R が多くの種類のデータ マイニング タスクに優れていることは明らかですが、テキストの分類に使用できます。

具体的には、テキストからバイグラムのリストを抽出し、それを 15 の異なるカテゴリのいずれかに分類します。

バイグラム一覧: ジュエリー、本、時計、靴、デパート -> カテゴリ: ショッピング

R でモデルをトレーニングするだけでなく、データベースに接続してこれをより大規模に実行したいと考えています。

Rでできますか?

4

1 に答える 1

1

うーん、私はむしろ機械学習を調べ始めていますが、提案があるかもしれません:あなたはWekaを検討しましたか?周りにはたくさんのさまざまなアルゴリズムがあり、いくつかのドキュメントがあります。RWekaさらに、 Wekajarを利用するRパッケージがあります。

編集:ウィッテンらによる素晴らしい、包括的な読み物もあります。:特に興味深いものの中でWekaの広範な説明を含むデータマイニング。APIの機会を調べてください。

于 2011-11-02T08:05:32.380 に答える