1

Endeca MDEX Engine Advanced Development Guide (6.2.2バージョン)の第6章では、ステミング用語のデフォルトのEndeca提供ディクショナリを補足するステミング更新X​​MLファイルの作成方法について説明しています。

ただし、ドキュメントには、新しいステミング更新ファイルをファイルシステムのどこに配置する必要があるかが指定されていないようです。

この XML ファイルは次の場所に配置する必要があります:

  • endeca/MDEX/version/conf/stemming フォルダー内?
  • endeca/MDEX/version/conf/stemming/custom フォルダー内?
  • ファイルシステムの任意の場所で、DataIngest.xml の --stemming-updates フラグを使用して、Dgidx 構成行に XML ファイルへの完全に指定されたパスを含めますか?
4

1 に答える 1

3

いくつかの試行錯誤の後、私はこれを機能させました。

正しい方法は、Dgidx の --stemming-updates パラメータの引数として、カスタム ステミング更新 XML ファイルへの完全に指定されたパスを含めることです。

私の endeca/apps/MyAppen/config/script/DataIngest.xml の関連部分は次のとおりです。

<dgidx id="Dgidx" host-id="ITLHost">
  ...
  <args>
    ...
    <arg>--stemming-updates</arg>
    <arg>/full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml</arg>
  </args>
</dgidx>

--stemming の更新と実際の完全に指定されたパスは、別々の <arg> タグにする必要があることがわかりました。両方をスペースで区切って同じ arg タグに入れようとすると、エラーが発生します。

ファイルへのパスを完全に指定しなくても、ステミング更新 XML ファイルを配置できる特定のフォルダーがある可能性がありますが、endeca/MDEX/version/conf/stemming フォルダーもステミング/conf フォルダーも機能しないことがわかりました。このため。試してみると、dgidx ログに次のようなエラーが表示されました。

ERROR   08/20/13 13:48:46.810 UTC (1377006526810)       DGIDX   {dgidx,baseline}        InputFileStream can't open file "stemmingExtension.en.xml" for reading        [err=`No such file or directory',errno=2]

また、Endeca MDEX Engine Advanced Development Guide、6.2.2 バージョンで提供されているサンプル XML にエラーがあることもわかりました。ドキュメントには、XML ファイルの最初の 2 行が次のように記載されています。

<!DOCTYPE WORD_FORMS_COLLECTION SYSTEM "word_forms_collection_updates.dtd">
  <WORD_FORMS_COLLECTION_UPDATES>

これは正しくありません。この形式のファイルを使用しようとすると、dgidx ログに次のエラーが発生します。

FATAL   08/20/13 13:56:33.533 UTC (1377006993533)       DGIDX   {dgidx,baseline}        Errors while parsing word forms updates from file "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Errors while trying to parse config stream "full/path/to/endeca/apps/MyAppen/config/script/stemmingExtension.en.xml": Error at file full/path/to/endeca/apps/MPen/config/script/stemmingExtension.en.xml, line 2, column 31; Message: Root element different from DOCTYPE

これを修正するには、次のように XML ファイルの DOCTYPE 行をルート タグと一致するように変更します。

<!DOCTYPE WORD_FORMS_COLLECTION_UPDATES SYSTEM "word_forms_collection_updates.dtd">
  <WORD_FORMS_COLLECTION_UPDATES>

この (明らかな) バグについて、Oracle サポートにチケットをオープンしました。

于 2013-08-20T14:20:16.590 に答える