問題タブ [pentaho-data-integration]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1434 参照

sql-server-2005 - MsSQL の名前付きインスタンスに接続するための JNDI の例

Pentaho Data Integration (オープン ソース ETL ツール) を使用しており、JNDI 接続を使用して MS SQL 2005 データベースに接続しようとしています。サーバーでデフォルトのインスタンスを使用すると問題なく動作しましたが、問題は名前付きインスタンスに接続しようとすることです。

例や場所を提供していただければ幸いです。

ありがとう。

0 投票する
3 に答える
5162 参照

etl - ケトル:行の各グループの最大日付を取得する方法

Kettle を使用して Excel シートを読んでいます。このシートには、コード、説明、日付の 3 つのフィールドがあります。

私が望むのは、次のように、各行に最大日付フィールドを追加することです。ここで、最大日付は、説明に基づくグループの最新の日付です。

例 2

説明 Aを持つ行のグループの最新の日付は 2013 年 1 月 15 日です (行 2 のため)。説明 Bを持つ行のグループの最新の日付は 2013 年 1 月 16 日です (行 5 のため)。

0 投票する
1 に答える
1212 参照

database-connection - pentaho ケトルで変換間でデータベース接続を共有する

変換に使用するデータベース接続を他の変換間で共有したいと考えています。

ペンタホケトルで可能ですか?はいの場合、どのように?

いいえの場合、すべての DB 接続を手動で再度定義する以外に、同じことに対する他の回避策はありますか?

0 投票する
0 に答える
1364 参照

python - Pentaho PDI: スクリプト タスクでのメタデータ関連の Null ポインター例外

Pentaho PDI 6 を次のように使用します。

A) .csv (IBM の 4 行 .csv ) での CSV 入力、ASCII ファイル エンコーディング (プレビュー行は正常に動作)

に接続されています

B) Tools -> MarketPlace からインストール可能なCPython Script Executor 。Python、Pandas、Numpy がインストールされていることを前提としています。スクリプト設定:

構成、入力フレーム: (前の手順)、df
Python スクリプト、手動 Python スクリプト:df.replace(to_replace= "\[|\]|'|\"", value='', regex=True, inplace=True)
出力フィールド、出力フィールド: (列名、文字列型)

スロー

以前のデバッグでは、processRow がメタデータ タイプを特定できない可能性があることが示されていますが、このエラーはこれを示していません。

質問: NullPointerExceptions をスローせずに .csv を読み取るようにスクリプト タスクを設定する適切な方法は何ですか?

編集 - ソース資料でもエラーが再現されます。参照: Mark Hall、Cpython Scriptingおよびサンプルの .zip ファイル

EDIT 1 -pythonコマンドプロンプトで

C:\Users\*****>python

Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:01:18) [MSC v.1900 32 bit (Intel)] on win32 Type "help", "copyright", "credits" or "license" for more information.

私は anaconda を実行していません (重量が重すぎます)。私のバージョンの Python は .1 進んでいます。これは影響を与える可能性がありますが、Python バイナリ プログラミング インターフェイスが変更されたり何かが変更されない限り、プラグインが Python のバージョンに依存しないことを願っています。

編集 2 - Kettle ファイルを添付できませんが、上記の Mark Hall のサンプル ファイルは、私が遭遇した同じ問題を再現しています。

0 投票する
0 に答える
299 参照

bash - API を呼び出してファイルをダウンロードしているときに Pentaho シェルがエラーをスローする

ペンタホ初心者です。Pentaho Shell で curl コマンドを使用して API を呼び出し、ファイルをダウンロードしたいと考えています。ファイルをダウンロードしていますが、ダウンロード中にエラー メッセージが表示されます。

  • 「シェル」ステップを変換ウィンドウにドラッグします
  • ステップを編集します。
  • 挿入スクリプトを確認し、作業ディレクトリを指定してください。
  • スクリプト ウィンドウで、curl コマンドを使用して API を呼び出します。

スクリプトは単なるcurlコマンドです

エラー メッセージがシェル ウィンドウに表示さ れる エラー メッセージを回避するにはどうすればよいですか?

0 投票する
0 に答える
1327 参照

mapping - ペンタホケトルのソースステップとターゲットステップの間で異なる数のフィールドをマップします

複数のデータベースを単一のデータベースに統合しようとしています。

問題は、すべてのデータベースが同じ列構造を持っているわけではないということです。

場合によっては、ソース テーブルの列数がターゲット テーブルよりもはるかに少ないことがあります。

私がやりたいことは、ソース テーブルとターゲット テーブルの間で共通の列をマップし、ターゲット テーブルの他の列を null に設定することです。

たとえば、ソース テーブルが 120 列で構成され、ターゲット テーブルが 180 列で構成されているとします。ソース テーブルの 120 列すべてをターゲット テーブルの対応する列にマップし、残りの 60 列をターゲットで null として残します。

ペンタホケトルで可能ですか?

現在、次のエラーが発生しています。

テーブル間の共通列のマッピングを定義しました。さらに情報が必要な場合はお知らせください。