オンラインテキストや記事を分類できるオープンソースエンジンプロジェクトはありますか?または、2つの記事の類似性を確認してください。
たとえば、1.iには10の異なるテキストまたは記事があります。そして、エンジンはこの記事をスポーツ、エンターテインメント、政治などのさまざまな分野に分類できます。
2.2つの記事が同じイベントについて説明しています。エンジンはそれらを組み合わせることができます。それらを同じ記事として扱う
ありがとうございました
オンラインテキストや記事を分類できるオープンソースエンジンプロジェクトはありますか?または、2つの記事の類似性を確認してください。
たとえば、1.iには10の異なるテキストまたは記事があります。そして、エンジンはこの記事をスポーツ、エンターテインメント、政治などのさまざまな分野に分類できます。
2.2つの記事が同じイベントについて説明しています。エンジンはそれらを組み合わせることができます。それらを同じ記事として扱う
ありがとうございました
Apache Mahout(オープンソース、Java)を見てください。
AlchemyAPIを使用してみることができます。オープンソースではありませんが、無料の使用階層があります。それらのトピックの分類と概念のタグ付けは、例1の場合に役立つ可能性があります。例2の場合、トレーニングはあるものの、ベイズ、ナイーブベイズなどの分類器のいずれかを使用できます。Wekaも広く使用されているツールです。