行を挿入する簡単なテストプログラムを作成しました。通常のHBasePutサンプルプログラムとの唯一の違いは、PutインスタンスとそのKeyValueインスタンスがタイムスタンプを使用して作成されることです。
予想される動作は、行が挿入されることです。ただし、私のHBase環境では、行は挿入されません。
以下は私のテストプログラムです。
import java.io.*;
import java.util.*;
import org.apache.hadoop.conf.*;
import org.apache.hadoop.hbase.*;
import org.apache.hadoop.hbase.client.*;
import org.apache.hadoop.hbase.util.*;
public class Test
{
// Names of table, family, qualifier and row ID.
private static final byte[] TABLE = Bytes.toBytes("test-table");
private static final byte[] FAMILY = Bytes.toBytes("test-family");
private static final byte[] QUALIFIER = Bytes.toBytes("test-qualifier");
private static final byte[] ROWID = Bytes.toBytes("test-rowid");
/**
* The entry point of this program.
*
* <p>
* This program assumes that there already exists an HBase
* table named "test-table" with a column family named
* "test-family". To create an HBase table satisfying these
* conditions, type the following at the hbase shell prompt.
* </p>
*
* <pre>
* hbase> create 'test-table', 'test-family'
* </pre>
*
* <p>
* This program inserts a row whose row ID is "test-rowid"
* with a column named "test-family:test-qualifier". The
* value of the column is the string expression of
* <code>new Date()</code>.
* </p>
*/
public static void main(String[] args) throws Exception
{
// Get the table.
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, TABLE);
// Prepare data to put.
byte[] value = Bytes.toBytes(new Date().toString());
Put put = new Put(ROWID);
put.add(FAMILY, QUALIFIER, value);
// Clone Put with a timestamp.
put = clone(put, 10);
// Put the data.
table.put(put);
// Read back the data.
Get get = new Get(ROWID);
Result result = table.get(get);
// Dump the read data.
System.out.println("DATA = " + result.toString());
}
/**
* Clone the given Put instance with the given timestamp.
*/
private static Put clone(Put a, long timestamp) throws IOException
{
// Create a Put instance with the specified timestamp.
Put b = new Put(a.getRow(), timestamp);
Map<byte[], List<KeyValue>> kvs = a.getFamilyMap();
// Copy KeyValue's from the source Put (a) to
// the cloned Put (b). Note the given timestamp
// is used for each new KeyValue instance.
for (List<KeyValue> kvl : kvs.values())
{
for (KeyValue kv : kvl)
{
b.add(new KeyValue(
kv.getRow(),
kv.getFamily(),
kv.getQualifier(),
timestamp,
kv.getValue()));
}
}
return b;
}
}
このプログラムによって生成されるコンソール出力は次のとおりです。
DATA = keyvalues=NONE
そして、hbaseシェルでの「スキャン」は「0行」と言います。
hbase(main):011:0> scan 'test-table'
ROW COLUMN+CELL
0 row(s) in 0.0080 seconds
以下のようにPutインスタンスを複製するためのコード行をコメントアウトします。
// Clone Put with a timestamp.
//put = clone(put, 10);
つまり、timestamp引数なしで作成されたPutインスタンスを使用すると、プログラムの動作が変わります。この場合、コンソール出力には挿入された値が表示されます。
DATA = keyvalues={test-rowid/test-family:test-qualifier/1344594210281/Put/vlen=28}
「スキャン」は挿入された行を示します。
hbase(main):012:0> scan 'test-table'
ROW COLUMN+CELL
test-rowid column=test-family:test-qualifier, timestamp=1344594210281, value=Fri Aug 10 19:23:30 JST 2012
1 row(s) in 0.0110 seconds
テストプログラムで使用されているタイムスタンプを使用してPutインスタンスのクローンを作成するロジックは、動作することがわかっているオープンソースプロジェクトからの抜粋です。したがって、この問題の根本的な原因は私のHBase環境にあると思いますが、私には手がかりがありません。私の調査は不十分かもしれませんが、HBaseログにエラーはまだ見られません。
誰かが私にこの問題について何か光を当ててくれませんか?