Hbase は、Map reduce ジョブのソースおよびシンクとして機能します。(vector writable) という名前の書き込み可能なカスタム クラスを作成しました。このクラスには 2 つのフィールドがあります。
private DoubleVector vector; // It is a Double Array
private byte[] rowKey; // The row key of the Hbase
私のマッパーはこれを値として発行するため、vectorWritable クラスに書き込みメソッドと読み取りメソッドを実装しました。
@Override
public final void write(DataOutput out) throws IOException {
writeVectorCluster(this.vector, this.rowKey, out);
}
@Override
public final void readFields(DataInput in) throws IOException {
this.vector = readVector(in);
this.rowKey = readRowKey(in);
}
public static void writeVectorCluster(DoubleVector vector, byte[] rowkey, DataOutput out)
throws IOException {
out.writeInt(vector.getLength());
for (int i = 0; i < vector.getDimension(); i++) {
out.writeDouble(vector.get(i));
}
int length = rowkey.length;
out.writeInt(length);
//Is this the right way ?
out.write(rowkey);
}
public static DoubleVector readVector(DataInput in) throws IOException {
int length = in.readInt();
DoubleVector vector = null;
vector = new DenseDoubleVector(length);
for (int i = 0; i < length; i++) {
vector.set(i, in.readDouble());
}
return vector;
}
@SuppressWarnings("null")
public static byte[] readRowKey(DataInput in) throws IOException {
int length = in.readInt();
byte [] test = null;
for (int i = 0; i < length; i++) {
// getting null pointer exception here
test[i] = in.readByte();
}
return test;
}
入力ストリームから rowKey を読み取ろうとすると、NullPointerException が発生します。ただし、 readVector メソッドは正常に機能し、正しい値を取得しています。
出力ストリームで取得できるように、DataInput ストリームにバイト配列を書き込むにはどうすればよいですか
UPDATE : SOLVED これは正常に動作する私の rowKey メソッドの更新です。ありがとう@Perception
public static byte[] readRowKey(DataInput in) throws IOException {
int length = in.readInt();
byte[] theBytes = new byte[length];
in.readFully(theBytes);
return theBytes;
}