Webから記事を取得するアプリケーションがあり、記事の最初の画像のURLを取得する必要があります。これらの画像のコードの例を次に示します。
<img alt="Twitter (zpower)" src="http://www.example.com/image.png" width="630" height="420">
srcの値だけを取得する必要があります。どうすればいいですか?
HTMLを解析し、src
属性を抽出する必要があります。手作業で行うこともできますが、より良い方法は、他の誰かの解析ライブラリ(たとえば、ElementParser)に依存することです。
@ravuya の応答を 2 番目にしたいと思いますが、組み込みのNSXMLParserを使用して解析を行うこともできることにも言及します。