0

Apache Oozie は現在、Spark ジョブをサポートしていないようですが、そうですか? スパークジョブをoozieに統合する方法はありますか?

4

2 に答える 2

1

spark はいつでも Java アクションとして実行できます。または、oozie でスパーク アクションを使用することもできます。スパーク アクションの詳細については、このリンクを参照してください -- https://github.com/apache/oozie/blob/master/client/src/main/resources/spark-action- 0.1.xsd

<java>
        <main-class>org.apache.spark.deploy.SparkSubmit</main-class>

        <arg>--class</arg>
        <arg>${spark_main_class}</arg> 

        <arg>--deploy-mode</arg>
        <arg>cluster</arg>

        <arg>--master</arg>
        <arg>yarn</arg>

        <arg>--queue</arg>
        <arg>${queue_name}</arg> -> depends on your oozie config

        <arg>--num-executors</arg>
        <arg>${spark_num_executors}</arg>

        <arg>--executor-cores</arg>
        <arg>${spark_executor_cores}</arg>

        <arg>${spark_app_file}</arg> 

        <arg>${input}</arg> -> some arg 
        <arg>${output}</arg>-> some other arg

        <file>${spark_app_file}</file>

        <file>${name_node}/user/spark/share/lib/spark-assembly.jar</file>
    </java>
于 2015-04-20T23:17:07.110 に答える
1

Spark の Oozie のサポートが予定されています。Jira を参照してください。これは現在トランクのみです。

それ以外の場合、オプションは Java またはシェル アクションとして実行されます。

于 2015-04-20T23:21:17.283 に答える