csv - データのストリームを開始時または終了時にフィルタリングする方がよいでしょうか。

Question

大量（数ギガバイト）のコンマ区切り値（CSV）ファイルを処理する必要があるプロジェクトに取り組んでいます。

私が基本的に行うことは次のとおりです。

ソース側で代わりにフィルタリングする方がよいかどうか疑問に思っています。たとえば、各リスナーには、特定のデータをリスナーにディスパッチするかどうかを決定する述語オブジェクトが関連付けられています。この場合、プロセスは次のようになります。

正味の効果は同じです、それはフィルタリングが行われる場所の問題です。

（繰り返しますが、一度に1つのエントリを処理するこの「ストリーム」データがある唯一の理由は、ギガバイトのCSVファイルを処理しており、コレクションを作成してフィルタリングしてから処理できないためです。それ-私は行くにつれてフィルタリングする必要があります）

score 2 · Accepted Answer

リスナーへの呼び出しのコストが膨大でない限り (Remoting、WCF など)、私は非常に単純なインターフェイスを使用し、リスナーに行の処理方法を決定させます。

1 に答える 1