CDH4.4を使用しています。現在、avro を介して hbase の単一の列にレコードをシリアル化するアプリを実行しています。このテーブルの現在の solr インデックスを solrcloud に移動中なので、MapReduceIndexerTool をテストして、テーブル全体の一括インデックス作成を行います。現在、「extractHBaseCells」を使用して HBase からレコードを読み取る非常に単純な morphlines ファイルがあります。
これをトレーサーの概念実証として設定し、rowkey => id のインデックスを作成し、avro blob を別のフィールドに詰め込むだけで、HBase から SolrCloud のコレクションにデータを取得でき、それが機能することを確認しました。しかし、私は avro を解析し、それらの値を solrdocuments の独自のフィールドに貼り付けてから、solrcloud に送信したいと考えています。しかし、「extractHBaseCells」の性質がこれを妨げているようです。モーフラインの avro コマンドに流れ込む可能性のある、より一般的な出力を生成する hbase リーダー コマンドがあれば、私は自分の問題を解決できると確信しています。
HBase に格納されている avro を解析するための既知の回避策、またはこれに対処できるその他の morphlines コマンドはありますか?