WordドキュメントのグループをSolrにインデックス付けして保存し、それらを複数値のテキストフィールドの要素として表示し、それぞれのコンテンツをインデックス内のその1つのエントリの下の要素として表示したいと思います。つまり、こんな感じです
- ID
- abcdef[Word_1.docxのテキスト]
- xyzabc[Word_2.docxのテキスト]
- efghij[Word_3.docxのテキスト]
インデックスに登録された各ドキュメントに独自の一意のIDを持たせたくありません。ドキュメントのグループは、特定のIDの子になります。そのIDには任意の数のドキュメントが存在する可能性があります。これを行う方法?
更新:これが私のC#コードです。で設定されている一意のIDについて、複数のドキュメントをこれに読み込むにはどうすればよい(++count).ToString()
ですか?
using (FileStream fileStream = File.OpenRead(path))
{
solr.Extract(
new ExtractParameters(fileStream, (++_count).ToString())
{
ExtractFormat = ExtractFormat.Text,
ExtractOnly = false,
Fields = new List<ExtractField>()
{
new ExtractField("action", actionTo),
new ExtractField("actiondate", actionDate),
new ExtractField("abstract", abstract),
new ExtractField("docval", docval),
new ExtractField("documentgeo",documentgeo),
new ExtractField("filename", filename),
new ExtractField("isprimary", IsPrimary.ToString())
},
AutoCommit = true
}
);
}