いくつかの試行錯誤の後、私はこれを機能させました。
正しい方法は、Dgidx の --stemming-updates パラメータの引数として、カスタム ステミング更新 XML ファイルへの完全に指定されたパスを含めることです。
私の endeca/apps/MyAppen/config/script/DataIngest.xml の関連部分は次のとおりです。
<dgidx id="Dgidx" host-id="ITLHost">
...
<args>
...
<arg>--stemming-updates</arg>
<arg>/full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml</arg>
</args>
</dgidx>
--stemming の更新と実際の完全に指定されたパスは、別々の <arg> タグにする必要があることがわかりました。両方をスペースで区切って同じ arg タグに入れようとすると、エラーが発生します。
ファイルへのパスを完全に指定しなくても、ステミング更新 XML ファイルを配置できる特定のフォルダーがある可能性がありますが、endeca/MDEX/version/conf/stemming フォルダーもステミング/conf フォルダーも機能しないことがわかりました。このため。試してみると、dgidx ログに次のようなエラーが表示されました。
ERROR 08/20/13 13:48:46.810 UTC (1377006526810) DGIDX {dgidx,baseline} InputFileStream can't open file "stemmingExtension.en.xml" for reading [err=`No such file or directory',errno=2]
また、Endeca MDEX Engine Advanced Development Guide、6.2.2 バージョンで提供されているサンプル XML にエラーがあることもわかりました。ドキュメントには、XML ファイルの最初の 2 行が次のように記載されています。
<!DOCTYPE WORD_FORMS_COLLECTION SYSTEM "word_forms_collection_updates.dtd">
<WORD_FORMS_COLLECTION_UPDATES>
これは正しくありません。この形式のファイルを使用しようとすると、dgidx ログに次のエラーが発生します。
FATAL 08/20/13 13:56:33.533 UTC (1377006993533) DGIDX {dgidx,baseline} Errors while parsing word forms updates from file "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Errors while trying to parse config stream "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Error at file full/path/to/endeca/apps/MPen/config/script/stemmingExtension.en.xml, line 2, column 31; Message: Root element different from DOCTYPE
これを修正するには、次のように XML ファイルの DOCTYPE 行をルート タグと一致するように変更します。
<!DOCTYPE WORD_FORMS_COLLECTION_UPDATES SYSTEM "word_forms_collection_updates.dtd">
<WORD_FORMS_COLLECTION_UPDATES>
この (明らかな) バグについて、Oracle サポートにチケットをオープンしました。