2

OpenTSDB でのダウンサンプリングに関する 2 つの質問があります。

1つ目は、OpenTSDBがダウンサンプリングを計算するときに最後のエンドポイントを包括的または排他的に取るか、またはエンドデータポイントを2回カウントするかを誰かが知っているかどうか疑問に思っていましたか?

たとえば、時間間隔が午後 12 時 30 分~午後 1 時 30 分で、午後 12 時 29 分 44 秒から 5 分ごとに DP を取得し、ダウンサンプル間隔が 10 分ブロックごとに合計される場合、システムは 12 時 30 分から DP を取得しますか? -12:39 とそれらの合計、12:40-12:49 とそれらの合計など、または 12:30-12:40 の DP、次に 12:40-12:50 の DP などを使用しますか? はい、私はデータが 15 秒ずれていることはわかっていますが、それを制御することはできません。

手で計算しようとしましたが、私が持っているデータは役に立ちません。私が計算している数値は、上記に加算されておらず、グラフが示しているものと一致していません. 数値を OpenTSDB にプッシュするシステムにアクセスできないため、チェックするダミー データをセットアップできません。

2 番目の質問は、ダウンサンプリングが時間範囲とダウンサンプル間隔からグラフにそのポイントをどのようにプロットするかということです。10 分のブロックを合計するようにダウンサンプルを設定しました。範囲を午後 12 時 30 分~午後 1 時 30 分に設定しました。このグラフは、ダウンサンプリングされたグラフの最初のポイントが午後 12 時 35 分に始まることを示しています。それは論理的に理にかなっています。
範囲を 12:24pm から 1:29pm に変更し、最初のポイントが 12:30 に開始されることを期待していましたが、最初に表示されたポイントは 12:25pm です。

うまくいけば、誰かが私のためにこれらの質問に答えることができます. それまでの間、ダウンサンプリングがどのように機能するかを示す/証明するのに役立つデータをシステムで見つけようと試み続けます。

よろしくお願いします。

4

1 に答える 1

10

ダウンサンプリングは現在、期待どおりに機能していませんが、これは合理的で一般的な期待であるため、OpenTSDB の今後のリリースでこれを変更することを検討しています。

「10 分の合計」を要求した場合、データ ポイントは各「ラウンド」(または「整列」) 10 分のブロック内で合計されると想定しています (例: 12:30-12:39 と 12:40)。あなたの例では-12:49)、しかしそれは起こりません。コードは、最初に見つかったデータ ポイントから 10 分間のブロックを開始します。したがって、最初のデータ ポイントが 12:29:44 の場合、コードは 600 秒後まで、つまり 12:39:44 まで、後続のすべてのデータ ポイントを合計します。

各 600 秒のブロック内には、さまざまな数のデータ ポイントが存在する場合があります。一部のブロックは、他のブロックよりも多くのデータ ポイントを持つ場合があります。ブロックによっては、データ ポイントの間隔が不均等になる場合があります。たとえば、すべてのデータ ポイントが 600 秒ブロックの先頭で互いに 1 秒以内にある場合があります。したがって、ダウンサンプリング操作の結果がどのタイムスタンプになるかを判断するために、コードはブロックのすべてのデータ ポイントの平均タイムスタンプを使用します。

したがって、すべてのデータ ポイントが 600 秒ブロック全体で等間隔に配置されている場合、平均タイムスタンプはブロックの中央のどこかに収まります。しかし、たとえば、すべてのデータ ポイントが 600 秒ブロックの先頭で互いに 1 秒以内にある場合、返されるタイムスタンプは平均であるため、それを反映します。明確にするために、コードは、選択したダウンサンプリング関数 (合計、最小、最大、平均など) に関係なく、タイムスタンプの平均を取ります。

実稼働システムに書き込むことなく OpenTSDB をすばやく試してみたい場合は、単一ノードの OpenTSDB インスタンスをセットアップすることを検討してください。入門ガイドに示されているように、非常に簡単に実行できます。

于 2013-09-14T05:34:05.733 に答える