表形式のデータをデータベースにインポートする必要があります。データは、複数の関係者からスプレッドシート(主にExcelファイル)を介して提供されます。これらの各ファイルの形式は似ていますが、同じではありません。データをインポートに適した最終的な形式に変換するには、さまざまな変換が必要になります。さらに、入力フォーマットは将来変更される可能性があります。入力ファイルを変換するために、通常のユーザーが実行および管理できるツールを探しています。
次に、私が実行しようとしている変換のいくつかをリストします。
- 列を交換します:
入力は次のとおりです。
|Name|Category|Price|
|data|data |data |
出力は
|Name|Price|Category|
|data|data |data |
- 列の名前を変更
入力は次のとおりです。
|PRODUCTNAME|CAT |PRICE|
|data |data|data |
出力は
|Name|Category|Price|
|data|data |data |
- 上記の例のように、ルックアップテーブルに従って列をマップします。列Categoryで文字列「Car」が出現するたびに「automobile」に置き換えます。
- 基本的な数学:価格列にいくつかの係数を掛けます
- 基本的な文字列操作Price列の形式が「3x$45」であるとしましょう。これを、金額と価格の2つの列に分割します。
- 値による行のフィルタリング:「高価」という単語を含むすべての行を除外します
- 等
次の要件があります。
- これらのプラットフォームのいずれかで実行できます:Windows、Mac、Linux
- オープンソース、フリーウェア、シェアウェアまたはコマーシャル
- 変換はGUIを介して編集可能である必要があります
- ツールを使用するためにエンドユーザーのトレーニングが必要な場合、それは問題ではありません
- 1000〜50000行のオーダーで処理できます
基本的に、私はユーザーがデータを正規化してインポートできるようにするのに役立つグラフィカルツールを探しています。アダプターをたくさん作成する必要はありません。
これを解決するためにどのツールを使用しますか?