1

XML 形式の記事が 1,000 万件あります。サンプル構造を以下に示します。

<address-book>
  <contact type="individual">
   <name c="10">Zane Pasolini</name>
   <address>999 W. Prince St.</address>
   <city>New York</city>
   <province>NY</province>
   <postalcode>10013</postalcode>
   <country>USA</country>
   <telephone>1-212-345-6789</telephone>
  </contact>
  <contact type="business">
   <name c="11">SAMOFIX d.o.o.</name>
   <address>Ilica 47-2</address>
   <city>Zagreb</city>
   <province/>
   <postalcode>10000</postalcode>
   <country>Croatia</country>
   <telephone>385-1-123-4567</telephone>
  </contact>
</address-book>

これらの XML ファイルのインデックス作成に Lucene 4.x を使用しています。また、これらの XML ファイルを変換する XSLT も用意して、ユーザーが適切に装飾された形式で表示できるようにします。

インデックス作成後、XML 構造はそのままでしょうか、それともフォーマットが失われるのでしょうか? たとえば、ユーザーが「個人」の連絡先タイプを検索する場合、XML ノードを含むすべてのデータを取得して、XSLT がそれらを適切に装飾された HTML に変換できますか?

4

0 に答える 0