3

複数のファイルからデータを抽出したいので、1 つの仮想列を必要とするファイル セット パターンを使用しています。データに問題があるため、サイレント スイッチも必要です。そうしないと、データを処理できません。サイレントスイッチで仮想列を使用すると、行が抽出されないようです。

@drivers =
EXTRACT name string,
        age string,
        origin string
FROM "/input/{origin:*}file.csv"
USING Extractors.Csv(silent:true);

仮想列を削除することで、単一のファイルからデータを抽出できることに注意してください。この問題の解決策はありますか?

4

1 に答える 1

2

まず、値を参照する予定がない場合は、ワイルドカードに名前を付ける (および仮想列を公開する) 必要はありません。このパターンで処理するファイルが多すぎないようにすることをお勧めしますが、実装が機能するように改善されるまで、仮想列をフィルターとして使用してファイル数を数千に制限することをお勧めします。より多くのファイルで。

少なくとも 1 つのファイルに 2 列の行が含まれていると思いますか? その場合は、バグを見つけたと思います。簡単な再現ファイル (動作する 1 つのファイルと動作しなくなった追加のファイルとスクリプト) を私のメール アドレスに送っていただけますか?

ありがとう!

于 2016-01-15T08:59:42.780 に答える