8

docx ファイルから (スタイルを使用して) 単語ごとに読み取るにはどうすればよいですか。2 つの docx ファイルを単語ごとに比較し、違いに基づいて別の docx ファイルに書き込む必要があります (C# と OOXML を使用)。DocumentFormat.OpenXml.Extensions.dllOpenXMLdiff.dll、およびICSharpCode.SharpZipLib.dllを使用してこれを達成しようとしましたが、単語ごとに読み取るオプションはありません(ICSharpCode.SharpZipLib は単語ごとに提供しますが、その単語に関連付けられたスタイルは提供されません)。

これに関するヘルプは非常に役立ちます。

4

2 に答える 2

3

このMSDNの記事では、ドキュメントの正確なテキストを段落ごとに確実に取得する方法を示しています。

http://msdn.microsoft.com/en-us/library/ff686712.aspx

同時に、各段落のスタイルを決定できます。それはとても簡単です。次のブログ投稿は、各段落のスタイルとテキストを取得する方法を示しています。

http://blogs.msdn.com/b/ericwhite/archive/2009/02/16/finding-paragraphs-by-style-name-or-content-in-an-open-xml-word-processing-document。 aspx

2つを比較しますか?それはあなたの正確に望ましいセマンティクスに依存します。1つのアプローチは、段落とスタイルを含むXMLドキュメントを作成してから、XMLドキュメントを比較することです。XMLドキュメントは次のようになります。

<Root>
  <Para>
    <Style>Normal</Style>
    <Text>This is the text of the paragraph.</Text>
  </Para>
  <Para>
    <Style>Heading1</Style>
    <Text>Overview of the Process</Text>
  </Para>
</Root>
于 2011-03-15T05:53:11.653 に答える
0

最も簡単な方法は、お気に入りの ZIP ライブラリを使用して DOCX ファイルを解凍し、テキスト ファイルをファイル IO ライブラリと比較することです。

于 2011-01-02T21:00:17.153 に答える