0

MICROARRAY DATA 用のデータ マイニング ソフトウェアである WEKA では、既存のデータ セットから冗長なタプルを削除するにはどうすればよいですか? 冗長性を取り除くコードは、JAVA である必要があります。

つまり、データ セットには次のようなデータが含まれます。

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0

ここで、タプル 1,4,5 は冗長です。

コードは、次の REDUNDANCY REMOVED データ セットを返す必要があります...

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
4

1 に答える 1

2

java.util.HashSetなどのSetを実装するクラスの 1 つを使用できます。

データ セットを Set にロードし、Set.toArray() メソッドを介して配列に変換するか、セットを反復処理することにより、データ セットを抽出できます。

Set<Tuple> tupleSet = new HashSet<Tuple>();

      
for (タプルタプル: tupleList) {    
    tupleSet.add(タプル);    
}  

// これですべてのタプルが一意になります  
for (タプルタプル: tupleSet) {    
    System.out.println("タプル: " + タプル);  
}  
于 2010-01-12T04:54:22.427 に答える