そのため、現在、Java で SAX パーサーを使用して、.docx ファイルのアーカイブ内にある「document.xml」ファイルを解析しています。以下は、私が解析しようとしているもののサンプルです...
サンプル XML ドキュメント
<w:pStyle w:val="Heading2" />
</w:pPr>
<w:bookmarkStart w:id="0" w:name="_Toc258435889" />
<w:bookmarkStart w:id="1" w:name="_Toc259085121" />
<w:bookmarkStart w:id="2" w:name="_Toc259261685" />
- <w:r w:rsidRPr="00415FD6">
<w:t>Text To Extract</w:t>
</w:r>
<w:bookmarkEnd w:id="0" />
<w:bookmarkEnd w:id="1" />
<w:bookmarkEnd w:id="2" />
今、私は属性値を取り出す方法を知っています。それは難しいことではありません。ただし、ノード内の実際のテキストにアクセスして解析する方法がわかりません。誰かがこれについてアイデアや以前の経験を持っていますか? 前もって感謝します。