“druid”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

2176 参照

lookup - Druid で登録済みルックアップが機能しない

私はドルイドを少しの間使っていて、登録されたルックアップ機能をテストしています。

次のように、http://:/druid/coordinator/v1/lookups の下に既にルックアップを作成しました。

私が理解している限りでは、このマッピングは、以下のクエリセクションで宣言されているディメンション「home_post_code」について、値「13210」を持つすべてのオカレンスを「Syracuse, NY」に置き換える必要があります。

問題は、クエリを実行すると、列「home_post_code_description」の値がマッピングに従って置き換えられないことです。

http://:/druid/listen/v1/lookups にルックアップを一覧表示できるので、適切に登録されていると思います。

ここで何が欠けていますか？何か構成を変更する必要がありますか?

前もって感謝します。

lookup druid

2016-10-06T21:22:52.080

0 投票する

0 に答える

796 参照

indexing - Druid / Tranquility (server) / Ingestion / Indexing が完了していない

私は Druid 0.9.1.1 と Tranquility 0.8.0 を使用しており、こちらのクイックスタート手順に従いました: http://druid.io/docs/0.9.1.1/tutorials/quickstart.html

次のコマンドは成功します。

次の応答が返されます。

...そして、Druid コンソールから、インデックス作成タスクが作成されたことを確認できました。

問題は、データソース (名前付きメトリック、スキーマにある仕様による) が表示されず、20 分経過したことです。インデックス作成はまだ RUNNING 状態です。

なぜそんなに時間がかかるのですか？だから私はこれをチェックしました: http://druid.io/docs/latest/ingestion/stream-push.html。「タスクの作成」セクションに早送りすると、次のように表示されます。

segmentGranularity は、各タスクによって生成されるセグメントがカバーする期間です。たとえば、「hour」の segmentGranularity は、それぞれ 1 時間をカバーするセグメントを作成するタスクを生成します。

データソースが表示されないのは、これが原因でしょうか (私のスキーマ仕様の segmentGranularity の値は 1 HOUR です)。

私が間違っている場合は、私を修正してください。

2016-10-11T18:05:52.550

0 投票する

1 に答える

1578 参照

time-series - 非時系列データのドルイド

データが生成されるとすぐに Druid に送信される場合は、(IoT のように) すべて問題ありません。大好きです。

しかし、今ではデータ入力の遅れに起因する別の状況があります。

エンドユーザーはオフラインになる (インターネット接続が失われる) 可能性があり、データは携帯電話に保存され、オンラインに戻ったときにのみ Druid に送信されます。

つまり、彼女がインターネットを回復するまでに、ドルイドに送信されたデータ (たとえば、Tranquility サーバーを介して) は、ドルイドによって拒否されます (ドルイドリアルタイムは過去のデータを受け入れないため)。

もちろん、データがサーバーに送信される時刻にタイムスタンプを設定できます。しかし、それはレポートを歪めます...、別のフィールド (たとえば、 generated_ts としましょう) を追加し、それをさらに別のディメンションとして宣言する場合を除きます。

しかし、そうなると、Druid (?) で無料で取得できる時間ベースの自動ロールアップの恩恵を受けることはできません。次のように、groupBy (その generated_ts をディメンションの 1 つとして) を使用する必要があります。

私の質問は次のとおりです。

アプローチは有効ですか？
はいの場合: 罰則は何ですか? （パフォーマンスだと思いますが、どれくらい悪いですか？）

ありがとう、ラカ

--

以下のRamkumarの回答への回答、フォローアップの質問：

私はまだこのバッチ取り込みをよく理解していません:

イベント A を考えてみましょう。これはタイムスタンプ 3 で生成され、タイムスタンプ 15 までサーバーに送信されませんでした。

タイムスタンプ 15 で送信されると、値は {ts: 15, generated_ts: 3, metric1: 12, dimension1: 'a'} になります。

キーのタイムスタンプは「ts」です。

不正確です。理想は {ts: 3, generated_ts: 3, metric1: 12, dimension1: 'a'} ですが、Tranquility が受け入れるように、insert_ts として 15 を指定する必要がありました。

ここで、バッチインジェスト中に修正したいと思います。正しい ts {ts: 3, generated_ts: 3, metric1: 12, dimension1: 'a'} になりました。

質問: その場合、イベントが重複しますか?

または...（これは私が推測する）：指定された時間間隔のバッチ取り込みは、基本的にその間隔内のすべてのデータを置き換えますか？（これが事実であることを願っています。そうすれば、データの重複について心配するのをやめることができます）

追加のメモ (ちょうど): 私はこれに出くわしました: https://github.com/druid-io/tranquility/blob/master/docs/overview.md#segment-granularity-and-window-period

それは言う：

Metamarkets での私たちのアプローチは、すべてのデータを Tranquility を介してリアルタイムで送信することですが、コピーを S3 に保存し、夜間の Hadoop バッチインデックス作成ジョブをフォローアップしてデータを再取り込みすることで、これらのリスクを軽減することもできます。これにより、最終的にすべてのイベントが Druid で正確に 1 回表現されることが保証されます。

ということは… 再摂取ということで、その意味は（推測ですが）完全な置き換えですよね？

time-series offline olap rollup druid

2016-10-12T18:08:54.760

0 投票する

0 に答える

199 参照

docker - 建物のドルイドが動かなくなって前に進まない

pulsarIO/dockerfilesで提供されている docker ファイルを使用してドルイドをビルドしようとしています。

しかし、それは完全にビルドされず、ある時点で動かなくなります:

スタックは次のようになります。

問題が何であるかを正確に理解できません！そして、私が実行しようとすると

実行中のコンテナを表示するコマンド druid コンテナが表示されません。

どんな助けでも大歓迎です!

docker druid

2016-10-25T07:50:31.243

0 投票する

1 に答える

283 参照

javascript - javascript を使用してデータを解析すると、druid kafka の取り込みが失敗する

kafka には特定の形式のメッセージがあります。それらはキャレット ^ で区切られています。静けさを使用してこれを解析するために、以下の解析仕様を使用しています。

ただし、kafka プロデューサーを介して行を挿入し、静けさのログを確認すると。を示していますdroppedCount=1。だから、メッセージをドロップしています。ブラウザで上記のjavascript関数を確認しました。それは正常に動作します。ここで何が問題なのですか？

javascript apache-kafka druid

2016-10-25T10:25:38.017

0 投票する

1 に答える

2102 参照

elasticsearch - Druid と ElasticSearch の違いは何ですか? 両方にとっての利点は何ですか？

私は Druid にかなり慣れていないので、ElasticSearch との比較に関する答えが得られません。このリンクを見つけました：druid vs Elasticsearchですが、違いや利点はありません。

誰かが私にそれを説明したり、Googleで見つけられなかったリンクをいくつか教えてもらえますか?

前もって感謝します。

J

elasticsearch druid

user6134689

2016-10-27T14:26:12.057

0 投票する

4 に答える

4028 参照

druid - Java アプリケーションからドルイドを照会する

私はドルイド初心者です。Java アプリケーションからリモートドルイドクラスタにクエリを実行したいと考えています。io.druid.client.DirectDruidClient を使用できる druid-user google グループを読みました。誰かが私を助けたり、同じ例のリソースを指摘したりできますか?

druid

2016-11-07T12:39:17.697

問題タブ [druid]

Reference