さまざまな機械学習アルゴリズムの自社開発プラットフォームを C# から R などのより堅牢なデータ マイニング プラットフォームに移植することを検討しています。R が多くの種類のデータ マイニング タスクに優れていることは明らかですが、テキストの分類に使用できます。
具体的には、テキストからバイグラムのリストを抽出し、それを 15 の異なるカテゴリのいずれかに分類します。
バイグラム一覧: ジュエリー、本、時計、靴、デパート -> カテゴリ: ショッピング
R でモデルをトレーニングするだけでなく、データベースに接続してこれをより大規模に実行したいと考えています。
Rでできますか?