Web ページからコンテンツを抽出しています。Web ページでは、電話番号や電子メール ID などの情報が画像に保存されます。そのテーブル内の画像とテキストも抽出したいと思います。出力文字列では、画像とテキストを含む Web ページに表示されるのと同じ方法で出力したいと考えています。
以下、Webページの内容です。
<table>
<tr>
<td>text</td>
<td><img src="" /></td>
</tr>
<tr>
<td>text</td>
<td><img src="" /></td>
</tr>
<tr>
<td>text</td>
<td><img src="" /></td>
</tr>
</table>
次のようにテキストと画像の両方を抽出できますか。
テキスト画像
テキスト画像
テキスト画像