問題タブ [kiba-etl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby - kiba etlスクリプト(kiba gem)で集約変換を行うには?
CSV から宛先 CSV へのソースを持つ Kiba Etl スクリプトを作成したい
Kiba ETL スクリプト ファイル
ユーザー.csv
result.csv (期待される結果)
etl トランスフォーマーは一度に 1 つの行で次々に実行されますが、2 番目のトランスフォーマーの動作は、transform メソッドに渡されるクラスでアクセスできない行のコレクション全体に依存します。
kiba gemを使用してこの動作を実現できるものはありますか
? よろしくお願いします
kiba-etl - kiba-etl gem を使用して行のロードをスキップすることはできますか?
kiba-etl gem を使用して行が無効であると判断した場合、特定の行の読み込みをスキップする方法はありますか?
たとえば、システムにロードする前に検証に合格する必要がある場合や、エラーが発生した場合でも、問題のログに関係なくデータを sys にプッシュする必要があります。
kiba-etl - パラメータを ETL ジョブに渡す方法は?
変数によって、さまざまなソースで実行される ETL を構築しています。
ジョブを実行するにはどうすればよいですか (rake タスク)
my のパラメーターを渡して、etl_file
そのソースに使用しますか?
source MySourceClass(variable_from_rake_task)
kiba-etl - リモート サービスからデータを取得し、それをローカル ORM モデルに変換し、関係を設定する ETL フローは?
最近、リモート サービスからデータを取得し、ローカル モデルに合わせて変更してから保存するように、最初の "etl" フローをセットアップしました。読み終わった今、いくつかの理由でかなりグロテスクに感じます
mysource
はリモート サービスからの JSON です
myは、オリジナルに基づいて、それぞれを新しく定義された localにtransform
置き換えますrow
model
source
row
transform
また、さまざまな値を見て、追加のローカル関係を定義します
destination
次に、現在ORMのモデルになっている.save
、新しく置き換えられたものを呼び出します。rows
- 外部データソースに基づいてローカル レコードを作成するにはどうすればよいですか? 私のモデルはリモート ソースのようには見えません。
row
新しい Model オブジェクトでエントリを置き換えるのは正しいですか? - の値
row
を自分のローカル モデルに置き換える場合、後続の各アクションをtransform
その新しい行 (現在はモデル) に分割する必要があると思いますか?
全体として、私の .etl は次のようになります
DoABunchOfWork クラスにはprocess
、さまざまな方法でリレーションシップを操作またはセットアップするために呼び出す約 6 つのメソッドがあります。
kiba-etl - Kibaを使用してルックアップを行うことは可能ですか
木場で「ルックアップ」を行うことは可能ですか。
これは、etl では非常に正常なプロセスであるためです。
はいの場合、デモを見せていただけますか。ありがとうございます。
ruby-on-rails - 変換を使用してキバで行を複製できますか?
現在、あなたの宝石を使用して、API を持たない個人データベースから Web スクレイピングされた csv を変換しています。
スクレイピングから、私はcsvになりました。私はあなたの宝石を使ってそれをかなりうまく処理することができます.1つだけ疑問に思っています
次のデータを検討してください。
これを次のように変換できます。
(私はこれを行うためにこのチュートリアルを使用しました: http://thibautbarrere.com/2015/06/25/how-to-explode-multivalued-attributes-with-kiba/ )
これには、ローダーで normalizelogic を使用しています。コードは次のようになります: source RowNormalizer, NormalizeArticles, CsvSource, 'RP00119.csv' transform AddColumnEntiteit, :entiteit, "ocmw"
私が疑問に思っているのは、変換を使用して同じことを達成できますか? コードは次のようになります。
質問は次のとおりです。変換クラスを使用して行を複製できますか?