0

Cascalog を使用して処理したい Json ファイルのディレクトリがあります。私が現在持っている解決策では、bash スクリプトを使用して、json ファイルからすべての改行文字を削除する必要があります。rsyncを使用してこれらのファイルを同期しているため、より良い解決策を探しています。

私の質問は、Cascalog でファイルの内容を読み取り、ファイルの内容を 1 つのタプルとして返すことができるかということです。現在、関数「lfs-textline」はファイル内の各行のタプルのシーケンスを返すため、改行文字を削除する必要があります。できれば、各ファイルの一連のタプルを返したいと思います。

(defn textline-parsed [dir]
    (let [source (lfs-textline dir)]
        (<- [?line]
            (source ?line))))
4

1 に答える 1

1

これを行うには、cascalog.more-taps の hfs-wholefile を使用します。

(:require [cascalog.more-taps :as taps])

(defn- byte-writable-to-str [bw]
  "convert byte writable to stirng"
  [(apply str (map char (. bw (getBytes))))])

そして、使用

(??<- [?str] 
    ((taps/hfs-wholefile path) ?filename ?file-content) 
    (byte-writable-to-str ?file-content :> ?str)
于 2015-08-27T03:03:03.217 に答える