pentaho - やかん結合行 - x より大きい最も近い要素

Question

pentaho ケトル (pdi とも呼ばれます) を使用して、2 つのデータストリームをマージする「行の結合 (デカルト積)」ステップを実行します。

1 番目と 2 番目のストリームの両方に数値が付加されています。例えば、

Stream 1 - Values 1, 3, 5
Stream 2 - Values 2, 4, 6

2 つのストリームを結合して、次の出力を取得したいと考えています。

(1, 2)
(3, 4)
(5, 6)

正しい出力とは、ストリーム 1 がストリーム 1 の値よりも大きい最小値を選択することです。

Join Rows ステップ内で、ストリーム 1 の値より大きい値を持つストリーム 2 を指定できます。残念ながら、これは次の誤った結果をもたらします。

(1, 2)
(1, 4)
(1, 6)
(3, 4)
(3, 6)
(5, 6)

Kettle の「Join Rows」の代わりに使用する必要がある別のステップはありますか? または、行の結合ステップの設定がありませんか?

注: Stream Lookup ステップの使用も検討しましたが、これは equals に対してのみ機能し、私のロジックでは機能しません。

ありがとう。

score 1 · Accepted Answer

あなたはすでに道半ばです。

(1, 2)
(1, 4)
(1, 6)
(3, 4)
(3, 6)
(5, 6)

「シーケンスを変更する値フィールドの追加」ステップを配置し、「次のフィールドの値が変更された場合にシーケンスを開始」を値 (Stream1) に設定します。結果のストリームは次のとおりです。

(Stream1, Stream2, result)
(1, 2, 1)
(1, 4, 2)
(1, 6, 3)
(3, 4, 1)
(3, 6, 2)
(5, 6, 1)

ソリューションとともに「example.ktr」をアップロードしました（Kettle 4.3.バージョンを使用しました）：

1 に答える 1