私はclojureを初めて使用するので、いくつかの例が必要です。clojureを使用してhtmlファイルを解析する方法を教えてください。
質問する
7736 次
3 に答える
17
Enliveはこのための優れたツールです。要するに:
(ns foo.bar
(:require [net.cgrand.enlive-html :as html]))
(defn fetch-page [url]
(html/html-resource (java.net.URL. url)))
これは、スクレーパー/パーサーとしてもテンプレートエンジンとしても使用するための優れたチュートリアルです。
これは、ページをスクレイピングする短い例です。
別のオプションはclj-tagsoupです。Enliveもtagsoupを使用しますが、さらにプラグイン可能なパーサーがあるため、他のパーサーのサポートを追加できます。
于 2013-03-18T10:50:59.480 に答える
4
ソースを解析してロードします。ソースは、URIに名前を付けるFile、InputStream、またはStringにすることができます。キー:tag、:attrs、および:contentを持つxml /elementstruct-mapのツリーを返します。およびアクセサfnsタグ、attrs、およびコンテンツ。他のパーサーは、startparseを渡し、fnがソースとContentHandlerを受け取り、パーサーを返すことで提供できます。
または、enliveを使用します。これは、完全にclojure上のフレームワークであるか、JavaベースのHtmlCleanerを使用します。
于 2013-03-18T10:58:43.183 に答える
1
HTMLパーサー
- clj-tagsoup clj
- クルトンclj
- ヒッコリーcljcljs
- Tupelo clj cljs
- Webmine clj
于 2020-10-28T19:09:06.790 に答える