HTMLを解析するためにhppleを使用しています。Xcode 4.6 と iOS 6.1 を使用しています。このように見えます。
以下を使用して、テキストと画像を抽出できますXPathQueryStrings
。
テキスト ==>//div[@class = 'entry-content']/p
画像 ==>//div[@class = 'entry-content']//img/@src
ただし、一番下にある「退職スタンプセット PDF」というテキストも取得する必要があります。このテキストは変更されますが、形式は通常同じです。私は次のパスを試しました、
div[@class = 'entry-content']//a[@title]//text()
しかし、それはうまくいきませんでした。これらすべてを配列に配置すると、そのエントリに対して null が返されることがわかりますが、テキストを取得したいと考えています。XPath 構文を見ましたが、それ以上進めることができません。誰か提案はありますか?