アトム フィード (xml) をスクレイピングしています。タグの 1 つには次のように書かれています。
<content type="html">
<p> Some text and stuff </p>
</content>
また、img と a タグに同じ html エンティティが表示されます。次のような img タグまたは p タグを見つけるための一般的な xpath はありますか。
//content/p or //content/img/@src
しかし明らかに、これはこれらの html エンティティでは機能しません。または、スクレイピーを使用した他のソリューションですか?