objective-c - HTML ファイルの読み取りと表現に最も適しているクラスはどれですか?

Question

初歩的な質問です。Foundation Class のプラットフォームとクラスの数は、徹底的に調査するのが圧倒的に多いため、SO コミュニティがすぐに答えを提供してくれることを願っています。

これは私のユースケースです：

html ファイルを読み込んで、 pタグ内のすべてのテキストを抽出したいと考えています。

html マークアップを表示する必要はありません。しかし、Webkit に解決策がある場合は、喜んで使用します。

Python の世界では、答えは Beautiful Soup になります。OSX ファウンデーションキットに相当するもの、または目標を達成できるクラスを探しています。

score 3 · Accepted Answer

オプションの 1 つとしてを使用NSXMLDocumentして渡すことができます。これにより、XHTML 以外のドキュメントを解析できるようになります (完全に不正な形式でない場合)。 NSXMLDocumentTidyXMLmask
NSXMLDocument

すべての p 要素のノードリストを取得するには、NSXMLDocumentインスタンスで次の XPath 式を使用できます
。

p ノードのテキストコンテンツを取得するには、stringValue プロパティを使用します。

1 に答える 1