1

このリンクをたどりました。ここに示すコードでは、次のようなトピックをクラスター化できませんでした:

    "Number theory",
    "Finite field",
    "Rational number",
    "Continued fraction representation",
    "Floating point",
    "Mughal architecture"

すべてが同じクラスターにありました。数学のトピックを 1 つのクラスターに入れ、他のトピックをそれぞれのクラスターに入れるにはどうすればよいですか?

4

2 に答える 2

0

これらのタイトルがあなたの知らない言語で書かれていると仮定すると、どのように進めますか?

追加情報がなければ、それはコンピュータ プログラムが直面するものです。これを正しく取得するチャンスはありません。

したがって、次のいずれかを行う必要があります

  • 追加情報を追加する 単語の類似性、たとえば WordNet に基づく

  • 記事全文などのテキストを追加する

于 2013-04-27T18:54:43.437 に答える
0

記事のテキストをクラスタリング アルゴリズムにフィードする必要があります。タイトルだけではあまりにもまばらで、必要な統計を行うのに十分な情報が含まれていません。

于 2013-04-26T09:47:07.707 に答える