問題タブ [data-quality]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
informatica - PowerCenter Designer でのオブジェクトの配置
2 つの質問があります。
1) ソース アナライザー ビューのオブジェクトを整理して、並べ替えられるように表示しようとしています。ただし、レイアウト コントロール パネルに移動すると、「すべてを配置」するソース アナライザー オプションが「グレー表示」されます。オブジェクトを整理または整理する方法はありますか?
2) ソース内のオブジェクトはインポート元の DB によって編成されていますが、ターゲットのナビゲーターにはそのような編成されたビューはありません。すべてのターゲットがナビゲーターにダンプされます! ナビゲーターのターゲット フォルダー内のテーブルのビューを整理する方法はありますか?
これらの特定の質問に対する回答をオンラインで見つけることができないため、基本的なように思われる場合はお詫び申し上げます。仲間の開発者を助けてくれてありがとう!
r - Datacheck : 文字列値 (入力) を R の既存の言語 (オランダ語辞書) と比較します
Rスクリプトを使用して、「ffff」や「fdaljfdlksajf」などのくだらないオープン回答(文字列変数)を除外しようとしています。これを行うことができるRで利用可能な何らかの辞書パッケージがあることを望みましたが、それを見つけることができないようです.
もう 1 つのオプションは、オランダ語 (私が必要とする辞書です) の単語のリストをアップロードして入力と比較することですが、見つけるのは簡単ではありません。
これまでにこれを試して解決策を見つけた人はいますか?
hadoop - Hive - 大きなテーブルに対して 1 つのパーティションの重複をチェックする最も効率的な方法
非常に大きな Hive テーブル (毎日数百万行が挿入される) で実行するクエリを作成しています。
(行が追加される前ではなく、追加された後に) 重複をチェックする必要があります。以下が最も効率的な方法なのか、それとも新しく挿入された行を既存のデータと照合して重複をチェックするだけなのか、疑問に思っていました。たとえば、これは OVER 句で実行できますか? それとも、効率の向上はありませんか?
テーブルはロード日に分割され、tez を使用します。