私はニュース分類のプロジェクトを行っています。基本的に、システムは事前に定義されたトピック (スポーツ、政治、国際など) に基づいてニュース記事を分類します。システムを構築するには、システムをトレーニングするための無料のデータ セットが必要です。
これまでのところ、数時間のグーグル検索とここからのリンクの後、私が見つけることができた唯一の適切なデータセットはthisです。これで十分だと思いますが、もっと見つけようと思います。
必要なデータセットは次のとおりです。
- タイトルだけでなく、完全なニュース記事が含まれています
- 英語です
- XML や db ではなく、.txt 形式で
誰でも私を助けることができますか?