問題タブ [data-quality]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
informatica - IDQ で xml ファイルを読み取る方法
IDQ で XML ファイルを読み取る必要があります。私はidqを初めて使用し、informatica power centerのような直接変換が利用できないため、xmlファイルの読み取り方法がわかりません。誰でもそれを達成する方法を簡単に説明してください。
前もって感謝します
python - 単一の列内で異なるデータ型を識別する方法は?
次の値を持つ列があるとします。
りんご、マンゴー、オレンジ、123、987、グァバ、2020/01/01
Python は、この列を「オブジェクト」データ型として自動的に認識します。1 つの列のデータ型の数を数えるタスクが与えられました。人間の目には、上記の列の値に文字列、整数、日付の 3 つのデータ型があることが明らかです。ただし、この分離を実行できるコードを思い付くことができません。ご案内お待ちしております!ありがとうございました!
postgresql - DAG で、テーブル内の主キー列を見つけて、Null 値があるかどうかをテストするにはどうすればよいですか?
DAG で DataQualityOperator を作成しています。Redshift テーブルにデータがあるかどうかを確認する必要があります。これを行うには、プライマリ列に null 値が含まれているかどうかを確認したいと思います。SQLで、列の主キーの名前を見つけました。null 値が含まれているかどうかを確認するにはどうすればよいですか? (これは、私の場合、テーブルが適切ではないことを意味します)。
これを達成する方法は?お手伝いありがとう。
python - Python/pandas を使用してデータセット内のクラスターまたは一貫した値を見つける
私はPythonが初めてで、イベント分析をしようとしています。2 つのデータセットがあります。1 つはイベントを含み、もう 1 つはストックデータを含みます。今、私は均等に重み付けされたポートフォリオを構築し、ポートフォリオ構築を毎月「更新」する必要があります。そのため、一貫したデータが必要です (推測します)。つまり、すべての日付について、この分析に含まれるすべての株式の株価が必要です。いいえ、この方法でデータをフィルタリングして、一定期間のすべての株式のデータがある最大の「クラスター」を表示したかったのです。別の方法として、データのあるすべての銘柄と期間を表示してください。皆さんが私の説明を理解してくれることを願っています。
この場合、2.5.2019 から 5.02.2019 までの a,b または 1.05.2019 から 4.5.2019 までの a,d などのいずれかが返されます。
パンダでこれのためのフォーラムはありますか?
事前にThx