0

私は ML で分類アルゴリズムを試しており、スポーツ、天気、テクノロジー、サッカー、クリケットなどのさまざまなカテゴリを区別するためにモデルをトレーニングするためのコーパスを探しています。

これらのカテゴリのデータセットをどこで見つけることができるかについての指針が必要です。

私にとって別の選択肢は、ウィキペディアをクロールして 30 以上のカテゴリのデータを取得することですが、これを行うためのより良い方法があれば、ブレインストーミングと意見を求めました。

編集

これらのカテゴリのバッグ オブ ワード アプローチを使用してモデルをトレーニングします。テスト - Web ページのコンテンツに応じて、新しい/未知の Web サイトをこれらの事前定義されたカテゴリに分類します。

4

1 に答える 1

4

UCI 機械学習リポジトリには、教師あり学習用の検索可能なデータセットのアーカイブが含まれています。

理想的なデータセットの入力と出力について、より具体的な情報を提供すると、より良い回答が得られる可能性があります。

編集:

于 2011-11-29T15:03:34.867 に答える