0

私の仕事では、週に1〜2回更新されて送信される、長いスプレッドシートで情報を検索する必要があります。最新のスプレッドシートでは、最後のスプレッドシートにあった情報が欠落していることがあり、必要な情報を見つけるためにいくつかの異なるスプレッドシートを調べる必要があります。最近、スプレッドシートをCSVファイルに変換して、データベーステーブルにアップロードできることを発見しました。数行のスクリプトで、探しているものとVoilaを入力するだけです。今、私は最新のスプレッドシートを手に入れました。古いスプレッドシートの上にそれをインポートできるかどうか疑問に思っています。データベースでプライマリに設定した行ごとに一意の番号があります。現在の情報の上にインポートしようとすると、プライマリが複製される行をスキップするだけですか、それともデータベースを台無しにするだけですか?

試してみる前に専門家に聞いてみようと思いました。ご入力いただきありがとうございます。

詳細:スプレッドシートは、私たちのクライアントで構成されています。各行には、クライアントの名前、一意のID番号、アドレス、および連絡先情報が含まれています。一意のIDを含む行をプライマリに設定してからアップロードできます。私の懸念は、csvファイルに新しい行を示すものが何もないことです(私は思います)。アップロードすると、重複をスキップするオプションが表示されますが、行全体またはそのセルだけがスキップされ、データが間違った行に配置されます。これは、ApacheサーバーIDKのmysqlのバージョンです。これには000webhostを使用しています。

4

2 に答える 2

2

ヒッグス、

データベース/ETLの用語におけるこの問題は、重複排除戦略と呼ばれます。これに対するテンプレートの答えはありませんが、これらの役立つ読み物をお勧めします。

学術論文-リレーショナルデータにおける複数のレコードタイプの共同重複排除

重複排除の記事

いくつかのオープンソースツール:

デュークツール

データクリーナー

于 2012-08-02T02:08:50.350 に答える
0

下部にある[インポート]をクリックすると、「重複を無視する」などの小さなチェックボックスが表示されます。思ったより簡単。

于 2012-08-11T06:30:37.997 に答える