0

わかりました - 私のプロジェクトでは、いくつかのデータを変換しなければならないプロセスのためのいくつかの検証テクニックを特定するよう求められました。背景を教えてください。

クライアントからデータを受け取ります - ファイルをロードし、処理に必要なフィールドのみを取り込みます。この段階でいくつかのチェックが行われます。ここから、基本的にすべての面倒な作業を行うスクリプトをデータに対して実行します。(重複の削除、日付の確認など)。次に、ブラックボックス システムを介して実行され、結果が出力されます。

特定のグループのカウントが大幅にずれているとクライアントから通知を受けました。これには約400万ドル。

pol_ID、Suf_ID、および関連するグループ名を生成することにより、一意のメンバーを識別するプロセスがあり、それらはシステム内および処理システム内で一意と見なされます。

これらの一意のメンバーのレコードを処理するプロセスが必要です。一意のメンバーは、特定の期間内に自分の名前に関連付けられた 1 つから複数のクレームを持つことができます。

クレーム情報を受け取ると、通常は payor_field + claimno + 生成されたシーケンス番号を使用して処理されます (このシーケンス番号は、claimno の最後の 2 桁である場合もあります)...

元。3 つのクレームがシステムに入り、負荷を処理した後、クライアントがクレーム番号を繰り返していることがわかります。最後の 2 桁を使用しているため、それらは一意ではなくなり、3 つのレコードのうちの 2 つが削除されます。最初のものだけを保持します。

WKS-01100 75.02 - stays
WKS-01100 6000.56 - drops
WKS-01100 560.23 - drops

私の問題が発生します。通常、最後の2桁を解析すると一意であるというクレーム番号を想定しているためです。このケースのテストでは、これを一意と見なすために別の列に明示的な増分シーケンス番号を作成しようとしました。これにより、結果が 2 倍になります。

今、私の質問は次のとおりです。

これらの主張を独自のものにする別の方法はありますか? 自動インクリメントはオプションではありません。クライアントが重複したクレーム番号を送信できることを考慮してください。これが問題の原因であり、クレーム番号をリサイクルできる可能性があります。

月ベースなので、最後に何らかの月IDがあるかもしれません..?

シーケンス番号のバイナリ表現は機能しますか? これは INT データ型です.. (また、24 か月前にさかのぼる履歴データを処理し、毎月次の連続する月のデータを取得し、セットの最初の月を削除することに注意してください)

私たちはこの主張を変えるために私たちが何をするかに制限されていないので、私は提案にオープンです...それを短くしようとしましたが、さらに情報を追加する必要がある場合はお知らせください:) ありがとう.

4

1 に答える 1

0

請求ごとにタイムスタンプを保存していますか? 考えられる解決策は、タイムスタンプを追加してクレームを一意にすることです。

WKS-01100-1330464175

WKS-01100-1327514036

WKS-01100-1341867984

于 2013-02-28T15:57:38.333 に答える