Pentaho と HBase は初めてです。Hbase テーブルからすべての列を読み取り、Pentaho を使用してフラット ファイルにロードしたいと考えています。
主なことの 1 つは、Hbase テーブルの列が静的ではないということです。30 列以上になる日もあれば、50 列以上になる日もあります。
PDIで「Hbase Input」を使ってみました。しかし、列数を定義することはできません。Pentaho で動的に変化する列を定義する方法はありますか??
列名について言及しないでください。列名が指定されていない場合は、すべての必須列が考慮されます。
ステップ 1: HBase 入力ステップの「マッピングの作成/編集」タブで、必要な Hbase テーブル名を呼び出し、そのテーブルの新しいマッピング名を作成します。
ステップ 2: 次に、[タプル テンプレートの作成] をクリックします。5 つの列が生成されます。
ステップ 3: [マッピングの保存] をクリックし、前のタブ [クエリの設定] に移動します。
ステップ 4: [マップされたテーブル名を取得] をクリックし、[マッピングの作成/編集] タブで呼び出したテーブルと同じテーブルを選択します。同じように、[指定されたテーブルのマッピングを取得] をクリックして、マッピング名を呼び出します。
ステップ 5: [キー/フィールド情報を取得] をクリックします。5列になります。
ステップ 6: ここで、必要な 3 つの列 (キー、列、値) のみを保持します。
これで、Pentaho ジョブは、必要な操作のために列を取得する準備が整いました。