1

もし私たちが持っていると仮定すると、

x=2, y=3,z=5, class="first"
x=3, y=5,z=10, class="second"

csvloader を使用するか、arrf を使用して、Weka で任意の分類子のインスタンスを作成できます。

しかし、もし私たちが持っているとしたらどうでしょうか、

x={2,3,4,5}, y={10,11,12,13}, z={6,3,9,5} class="biogancy"
x={7,6,2,3},y={3,2,8,4}, z={4,3,9,7} class="uiopnt"

行ごとにインスタンス オブジェクトを作成するにはどうすればよいですか? csvloader のような簡単な方法はありますか? csvファイルで上記の行を管理するにはどうすればよいですか? xml を使用する必要がありますか? もしそうなら、どうすればWEKAの行の上からインスタンスを構築できますか?

4

2 に答える 2

0

関係属性は、あなたの説明に最も近いものです。複数のインスタンスを使用できますが、使用できるバッグは 1 つだけです: http://weka.wikispaces.com/Multi-instance+classification

ARFF 形式を使用してデータを指定できます。csv ファイルを使用する必要がある場合は、ローダーを自分で実装する必要がある場合があります。

ただし、セットをブール値を持つ合理的な数の属性に分解できる場合は、そうします。wiki で説明されているように、マルチインスタンス分類子を提供するパッケージ weka.classifiers.mi は 1 つだけです。

とにかく複数のバッグを使用する必要があるようです。この場合、別の代替手段を探すことをお勧めします。

于 2011-08-28T23:21:10.310 に答える
0

別の代替案を提案できますか?

それぞれの値が離散的で制限されている場合、バイナリ属性を作成して各セットをモデル化できます。たとえば、x、y、z がすべて {1,2,3} の部分集合であるとします。この場合、インスタンスには 9(+1) 個の属性が含まれます。

x1, x2, x3, y1, y2, y3, z1, z2, z3, class

この表現はニーズに対してまばらすぎるかもしれませんが、それでもインスタンスの完全な数学的記述です。まばらな問題に取り組むには、WEKA の優れた機能選択ツールを使用することをお勧めします。それでも十分でない場合は、より洗練された次元削減方法にいつでも頼ることができます。

于 2011-08-29T06:56:29.553 に答える