0

私はかなりフロントエンドに偏った開発者なので、バックエンドの奇妙な概念は、特にjsの世界の外では理解するのが難しい場合があります(ノード、エクスプレスバックエンドを知っています)。

falcon のフロントエンド (hadoop) を開発する必要があります。UI で新しいフィードを作成できる必要があります。ユーザーは、プロセス ワークフローを定義できます。ユーザーは、フィードまたはプロセスを作成する前に、少なくとも 1 つのクラスターを定義または作成する必要があります。

それらは私が受け取ったいくつかのreqです

私の質問は次のとおりです。

Feed エンティティはドキュメントまたはオブジェクトのように動作しますか? json オブジェクトに似ているとしましょう?

クラスターは、さまざまなタスクが行われる別の場所にあるだけですか? (Hadoop、ハヤブサの生き方を意味します)

プロセス エンティティは、フィード エンティティで実行するタスクのライフサイクルにすぎませんか?

クラスター エンティティは、タスクの個別のグループにすぎませんか?

そのバックエンドと通信するための REST API があることは知っていますが、それでフィードやクラスターなどを管理するのに十分でしょうか? または制限がありますか?

編集

時間の経過とともに追加したいysrの回答には、より正確な理解があります。

エンティティ (フィード、プロセス、クラスター) は xml 形式で定義、送信、取得されます。エンティティの仕様はこちらhttp://falcon.apache.org/EntitySpecification.html

REST API はhttp://falcon.apache.org/restapi/ResourceList.htmlであり、それを使用してエンティティのライフサイクルを管理できます。

フロントエンドの観点からは、それ以上のことを知る必要はありませんでした。

4

1 に答える 1

2

Falcon は基本的に 3 種類のエンティティを使用します。

1.クラスター 2.フィード 3.プロセス

クラスター - 基本的に、hdfs エンドポイント、ジョブ トラッカー エンドポイント、yarn エンドポイント (yarn を使用している場合)、oozie エンドポイント、activemq エンドポイントなどのシステム全体のプロパティが含まれます。

フィード - データに関連します。フィード定義には、データ パス、データの可用性の頻度、保持とレプリケーションの詳細などの情報が含まれます。

プロセス - 特定の頻度で実行されるジョブに関連します。プロセスは 1 つ以上のフィードを消費し、別のフィードを生成します。プロセス定義には、ジョブが実行される頻度、消費される入力の範囲、生成される出力、ワークフロー定義パスなどの情報が含まれます。

また、Falcon には、サーバーと通信するための十分な REST API が含まれています。現在、そのような制限はありません。何か見つけた場合、私たち (falcon-dev) は喜んであなたの変更を取り入れます。

于 2015-02-18T13:04:04.327 に答える