1

初歩的な質問です。Foundation Class のプラットフォームとクラスの数は、徹底的に調査するのが圧倒的に多いため、SO コミュニティがすぐに答えを提供してくれることを願っています。

これは私のユースケースです:

html ファイルを読み込んで、 pタグ内のすべてのテキストを抽出したいと考えています。

html マークアップを表示する必要はありません。しかし、Webkit に解決策がある場合は、喜んで使用します。

Python の世界では、答えは Beautiful Soup になります。OSX ファウンデーション キットに相当するもの、または目標を達成できるクラスを探しています。

4

1 に答える 1

3

オプションの 1 つとして を使用NSXMLDocumentして渡すことができます。 これにより、XHTML 以外のドキュメントを解析できるようになります (完全に不正な形式でない場合)。 NSXMLDocumentTidyXMLmask
NSXMLDocument

すべての p 要素のノード リストを取得するには、NSXMLDocumentインスタンスで次の XPath 式を使用できます

p ノードのテキスト コンテンツを取得するには、stringValue プロパティを使用します。

于 2013-05-29T10:55:20.833 に答える