0

私はこのようなXMLデータフィールドを持っています

<some info></some info><Some info2></some info2><description><lot of info></description><some more info></some more info><description><info></description>

<description>anything</description> すべての「description」タグを削除する正規表現が 必要です。(それらは任意の数である可能性があります)

これをSolrスキーマの文字パターンフィルターとして配置する必要があります。

4

1 に答える 1

2

あなたはあなたにどちらかを言うだろう何人かの人々を得るかもしれません:

  1. RegExを使用してXMLを解析することはできません。
  2. DOMライブラリを使用する必要があります。

ただし、<description>タグ間のものを削除するだけの場合は、検索し<description>.*?</description>て何も置き換えないようにするだけです。

于 2012-06-05T07:17:57.187 に答える