問題タブ [data-quality]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

87 問題

0 投票する

1 に答える

429 参照

informatica - IDQ で xml ファイルを読み取る方法

IDQ で XML ファイルを読み取る必要があります。私はidqを初めて使用し、informatica power centerのような直接変換が利用できないため、xmlファイルの読み取り方法がわかりません。誰でもそれを達成する方法を簡単に説明してください。

前もって感謝します

informatica data-quality

2019-10-21T16:13:09.517

0 投票する

2 に答える

124 参照

python - 単一の列内で異なるデータ型を識別する方法は?

次の値を持つ列があるとします。

りんご、マンゴー、オレンジ、123、987、グァバ、2020/01/01

Python は、この列を「オブジェクト」データ型として自動的に認識します。1 つの列のデータ型の数を数えるタスクが与えられました。人間の目には、上記の列の値に文字列、整数、日付の 3 つのデータ型があることが明らかです。ただし、この分離を実行できるコードを思い付くことができません。ご案内お待ちしております！ありがとうございました！

2020-02-21T21:08:35.430

0 投票する

1 に答える

111 参照

postgresql - DAG で、テーブル内の主キー列を見つけて、Null 値があるかどうかをテストするにはどうすればよいですか?

DAG で DataQualityOperator を作成しています。Redshift テーブルにデータがあるかどうかを確認する必要があります。これを行うには、プライマリ列に null 値が含まれているかどうかを確認したいと思います。SQLで、列の主キーの名前を見つけました。null 値が含まれているかどうかを確認するにはどうすればよいですか? (これは、私の場合、テーブルが適切ではないことを意味します)。

これを達成する方法は？お手伝いありがとう。

postgresql airflow data-quality

2020-04-24T12:53:37.533

0 投票する

1 に答える

72 参照

python - Python/pandas を使用してデータセット内のクラスターまたは一貫した値を見つける

私はPythonが初めてで、イベント分析をしようとしています。2 つのデータセットがあります。1 つはイベントを含み、もう 1 つはストックデータを含みます。今、私は均等に重み付けされたポートフォリオを構築し、ポートフォリオ構築を毎月「更新」する必要があります。そのため、一貫したデータが必要です (推測します)。つまり、すべての日付について、この分析に含まれるすべての株式の株価が必要です。いいえ、この方法でデータをフィルタリングして、一定期間のすべての株式のデータがある最大の「クラスター」を表示したかったのです。別の方法として、データのあるすべての銘柄と期間を表示してください。皆さんが私の説明を理解してくれることを願っています。

この場合、2.5.2019 から 5.02.2019 までの a,b または 1.05.2019 から 4.5.2019 までの a,d などのいずれかが返されます。

パンダでこれのためのフォーラムはありますか?

事前にThx

python pandas events data-quality

2020-05-17T13:26:14.970

1 2 3 4 5 6 7 8 9 10

問題タブ [data-quality]

informatica - IDQ で xml ファイルを読み取る方法

python - 単一の列内で異なるデータ型を識別する方法は?

postgresql - DAG で、テーブル内の主キー列を見つけて、Null 値があるかどうかをテストするにはどうすればよいですか?

python - Python/pandas を使用してデータセット内のクラスターまたは一貫した値を見つける

Reference