Open XML Office SDK 2.0 を使用して Word 文書内の文字列を検索し、それらを一覧表示しています。
MatchCollection Matches;
using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(txtLocation.Text, true))
{
string docText = null;
using (StreamReader sr = new StreamReader(wordDoc.MainDocumentPart.GetStream()))
{
docText = sr.ReadToEnd();
}
Regex regex = new Regex(@"\(.*?\)");
Matches = regex.Matches(docText);
}
int i = 0;
while (i < Matches.Count)
{ Label lb = new Label();
lb.Text = Matches[i].ToString();
lb.Location = new System.Drawing.Point(24, (28 + i * 24));
this.panel1.Controls.Add(lb);
i++;
}
問題は、(HelloWorld) のように正しい文字列を返すこともありますが、< w:rFonts w:ascii="Arial" w:hAnsi="Arial" w:cs="Arial "/ >
どうすればそれらを取り除くことができますか?