6

私はclojureを初めて使用するので、いくつかの例が必要です。clojureを使用してhtmlファイルを解析する方法を教えてください。

4

3 に答える 3

17

Enliveはこのための優れたツールです。要するに:

(ns foo.bar
  (:require [net.cgrand.enlive-html :as html]))

(defn fetch-page [url]
  (html/html-resource (java.net.URL. url)))

これは、スクレーパー/パーサーとしてもテンプレートエンジンとしても使用するための優れたチュートリアルです。

これは、ページをスクレイピングする短い例です

別のオプションはclj-tagsoupです。Enliveもtagsoupを使用しますが、さらにプラグイン可能なパーサーがあるため、他のパーサーのサポートを追加できます。

于 2013-03-18T10:50:59.480 に答える
4

Clojureのxml 解析ライブラリが用意されています。

ソースを解析してロードします。ソースは、URIに名前を付けるFile、InputStream、またはStringにすることができます。キー:tag、:attrs、および:contentを持つxml /elementstruct-mapのツリーを返します。およびアクセサfnsタグ、attrs、およびコンテンツ。他のパーサーは、startparseを渡し、fnがソースとContentHandlerを受け取り、パーサーを返すことで提供できます。

または、enliveを使用します。これは、完全にclojure上のフレームワークであるか、JavaベースのHtmlCleanerを使用します。

于 2013-03-18T10:58:43.183 に答える
1

HTMLパーサー

ソース-https://www.clojure-toolbox.com

于 2020-10-28T19:09:06.790 に答える