cluster-analysis - プロパティに基づいてオブジェクトを分類する方法を探しています

Question

約 150 個の異なるプロパティを持つ約 10,000 個のオブジェクトのセットがあり、その約 4 分の 1 は多値であるか、他のプロパティに関連しています。

これらのオブジェクトを分類したい約 120 のカテゴリのセットがあり、各カテゴリは「テンプレート」オブジェクトとして定義されています。インスタンスがテンプレートと完全に一致する場合、そのオブジェクトは明らかにそのカテゴリに含まれます...ただし、完全に一致するテンプレートを実際に持っているオブジェクトは約 10% にすぎません。その結果、カテゴリとの類似性に基づいてオブジェクトにスコアを付け、それらを最も一致するものに分類できるようにしたいと考えています。また、非常に類似したオブジェクトのクラスターを特定したいと思います。これは、新しい/洗練されたカテゴリの可能性を示しています。

これは、Weka、RapidMiner、またはその他の機械学習/クラスタリング/分類システムの仕事のようです。しかし、この分野の優れた入門資料を見つけるのに苦労しているため、この場合にこれらのツールを使用するのにどれだけの労力がかかるかわかりません。これは継続的なニーズになる可能性があるため、分析方法や重みなどを簡単に変更できるものを使用したいと考えています.

考え？

score 1 · Accepted Answer

話しましょう..
あなたの任務がこれらのオブジェクトを分類することであるなら、あなたは手動でそれらを狂わせることができるでしょう!

私は同様のデータセットを分析していますが、常に同じポイントに戻ってきます... これらのオブジェクトは~基本的に~同じです。

それらを分離するファジーロジックは聖杯です..しかし、聖杯はファジーです...:(
あなたに何ができますか?...上司にファジーな式を与えますか?それはしばらく続きます..

あなたは一生を過ごすことができますパターンを見つけようとしていますが、それでは失敗する可能性があります - 定量化できるものに視点を移してみませんか? アウトプットに集中してください..

score 0 · Accepted Answer

RapidMinerには、統合されたオンラインチュートリアルが付属しています。RapidMiner を起動し、[ヘルプ]、[RapidMiner チュートリアル] の順に進みます。また、Rapid-I Web ページから無料の PDF RapidMiner チュートリアルをダウンロードすることもできます。また、Rapid-I の Web ページには、RapidMiner の無料の紹介ビデオがあり、Rapid-I の Web ページのサービスセクションを確認すると、多くの RapidMiner トレーニングコースがあります。

score 0 · Accepted Answer

開発したいのは、知識工学エンジンの一種である事例ベースの推論システムです。

myCBR と Protege を調べてください。Protege はスタンフォード大学のオントロジーエンジニアリングエンジンであり、myCBR は Thomas R. Roth-Berghofer によって開発された事例ベースの推論システムです。

MyCBR は Protege にプラグインし、一緒にすると、まさにあなたがやりたいことを実行できます。

重要事項:

データを CSV 形式で保存し、完全にクリーンであることを確認してください。完全でない場合、Protege/myCBR で問題が発生する可能性があります。
何かをインポートしようとする前に、myCBR の指示を読んでください。
データのエクスポートはより困難ですが、理論的には結果を Java モジュールとしてエクスポートできます。Protege はオープンソースであり、myCBR も同様です。したがって、ライセンス料はないと思います。
カテゴリの重みを設定できます。これは、さらに役立つ場合があります。

弟子：

http://protege.stanford.edu/

myCBR:

http://mycbr-project.net/

cluster-analysis - プロパティに基づいてオブジェクトを分類する方法を探しています

3 に答える 3

Related

Reference