分析サーバーがあります (たとえば、クリック カウンター)。APIを使用してドルイドにデータを送信したい。どうすればいいですか?Google アナリティクスの代わりとして使用できますか?
4 に答える
se7entyse7en が言ったように:
データを Kafka に取り込み、druid のKafka firehoseを使用して、リアルタイムの取り込みでデータを druid に取り込むことができます。その後、その API を使用してインタラクティブにドルイドにクエリを実行できます。
ファイアホースは Druidリアルタイム ノードでのみ設定できると言わなければなりません。
Kafka firehose をセットアップする方法のチュートリアルを次に示します: Loading Streaming Data。Kafka firehose のほかに、Amazon S3 firehose、RabbitMQ firehose などの他の提供された firehoseを含めることでセットアップできます。また、拡張機能として独自の firehose を作成することもできます。例はhereです。ここにすべてのドルイド拡張機能があります。
ここで説明されているように、Druid はリアルタイムの取り込みをリアルタイム ノードからインデックス サービスに移行していると言わざるを得ません。
現時点でのベスト プラクティスは、Indexing Serviceで Realtime Index Task を実行することです。その後、Druid の API を使用してこのタスクにデータを送信できます。API を直接使用することもできますが、 Tranquilityを使用する方がはるかに簡単です。これは、新しいセグメントの新しいリアルタイム インデックス タスクを自動的に作成するライブラリであり、適切なタスクにメッセージを送信できるようにします。レプリケーションやシャーディング レベルなどを設定することもできます。インデックス サービスを実行し、Tranquility を使用するだけで、Druid へのメッセージの送信を開始できます。
データを Kafka に取り込み、druid の Kafka firehose を使用して、リアルタイムの取り込みを通じてデータを druid に取り込むことができます。その後、その API を使用してインタラクティブにドルイドにクエリを実行できます。
あなたのドルイドが 0.9.x バージョンであることを考えると、使用する最良の方法は静けさです。残りの API は非常に堅牢で、データ スキーマを制御できます。druid.ioクイックスタートページに移動し、[ストリーミング データの読み込み] セクションに移動します。
ウェブサイトのクリックストリーム データをリアルタイムで読み込んでいますが、非常にうまく機能しています。したがって、はい、Google アナリティクスを druid に置き換えることができます (必要なインフラストラクチャがあると仮定します)。