部門のすべてのフォーマットを保持しながら、Web サイトの詳細コンテンツを抽出する必要があります。抽出したいセクションは次のとおりです。
...
<div class="detailContent"><p>
<P dir=ltr><STRONG>Hinweis</strong>: Auf ... </p>
</div>
...
私の現在の解決策は、libxml2 と xpath の HTMLParser を使用してノードを見つけ、すべてのノードを調べてこの HTML の一部を再構築することです。これは長くて複雑なコードです。
HTML の一部を抽出するためのより簡単な解決策があるかどうか疑問に思っています。
ありがとう。