36

データ ストリーム管理に関する長い記事を読んでいて、スライディング ウィンドウとタンブリング ウィンドウの違いに少し混乱しています。これまでのところ、タンブリング ウィンドウは時間ベースにすることができ、そのウィンドウの有効期限が切れると "タンブル" する (開始、終了) ポイントが固定されていることを理解しました。たとえば、時間ベースのウィンドウは 1 分間の長さにすることができます。そのため、ウィンドウは 1 分ごとにタンブルして、データ セットの集計を処理します。

私を混乱させるのは引き戸です。x 個のタプルがウィンドウに入ったときにウィンドウがタンブルするように、カウントベースのようなスライディング ウィンドウです。または、ウィンドウに入った最近のタプルがウィンドウの一部になり、古いタプルがそのウィンドウから追い出されるということですか。つまり、新しいタプルが到着すると継続的に更新されるウィンドウですか?

4

3 に答える 3

18

タンブリングウィンドウ(TW) ウィンドウ内のすべてのタプルが同時に期限切れになります。

スライディングウィンドウ(SW) 特定の時間に期限切れになるタプルの一部のみ

次の整数が入力されたウィンドウ(表記整数(入力されてからの秒数))があり、TWが60秒前に作成され、両方のウィンドウの制限時間が60秒であるとします。

1 (0s), 2 (10s), 4 (24s), 8 (17s), 16 (40s)

20秒が経過すると、次の整数がウィンドウに入ります。

7, 3, 6

これで、前のTWの有効期限が切れ、上記の値のみが含まれます。SWには次の値が含まれますが

7, 3, 6, 1, 2, 4, 8
于 2012-11-05T11:20:13.613 に答える