MergeContent プロセッサを使用してディスクにファイルを書き込もうとしていますが、ファイル サイズが 1 行から 806 行まで大きく異なります。Apache NIFi MergeContentプロセッサで対処されているように改行区切り記号を見つけようとして、このプロセスを何度も繰り返しました-区切り記号を改行として設定すると、本当にランダムなサイズのファイルが得られました。
次のロジックに準拠するには、どのパラメーターを設定する必要がありますか?
- 単一のビンを確立する
- すべてのフローファイルをビンにルーティングします
- len(bin)>X またはビンの年齢が Max Bin Age より大きい場合、ビンを解放します。
ご覧のとおり、 https://github.com/apache/nifi/blob/31fba6b3332978ca2f6a1d693f6053d719fb9daa/nifi-nar-bundles/nifi-standard-bundleの構文に従って、「Max Bin Age」を「10 秒」に設定しました。 /nifi-standard-processors/src/test/java/org/apache/nifi/processors/standard/TestMergeContent.java#L219 (この値の例を見つけることができた唯一の場所です。ドキュメントは不完全なようですこのパラメーターで)
「エントリの最大数」を 5000 に、「ビンの最大数」を 1 に設定しました。
上記のロジックに従ってレコードを集計するにはどうすればよいですか? また、この時点に到達するすべてのドキュメントで同一であることが保証されている属性を持つ「相関属性名」パラメーターを使用してみましたが、同じことがわかりました