私のアプリケーションは、Spark を使用する Java Maven プロジェクトです。スタンフォードcoreNLP依存関係を追加する私のpomのセクションは次のとおりです。
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
</dependency>
<dependency>
<groupId>edu.stanford.nlp</groupId>
<artifactId>stanford-corenlp</artifactId>
<version>3.6.0</version>
<classifier>models</classifier>
</dependency>
次のエラーが表示されます。
java.lang.NoClassDefFoundError: edu/stanford/nlp/pipeline/StanfordCoreNLP
Spark などの他の依存関係があり、dataproc はそれらを正常にプルします。今、coreNLP を追加しました。ラップトップでは問題なく動作しますが、google dataproc では失敗します。