10

良い参考書を探しています

Clojure を使用した大規模なデータ マイニング

私は、多くの優れた clojure プログラミングの本 (Programming Clojure、Joy of Clojure など) と、多くの優れたデータ マイニングの教科書 (大量のデータ セットのマイニング、ギガバイトの管理など) を知っています。ただし、具体的に対処する参照は認識していません

Clojure を使用した大規模なデータ マイニング

「with clojure」の部分は、次の理由から私にとってかなり重要です。

* most theoretical analysis uses big-Oh running time, which ignores constants
* constants matter, if it ends up being a matter of 1 second vs 1 hour (for things that need to be real time)
* or 1 hour vs 1 week (for batch jobs)

特に、JVM、Clojure データ構造の間には、データがメモリに格納されているか、ディスクから遅延して読み取られているかに関係なく、多くの相互作用があると思います。「同じ」アルゴリズムでも、実装が「わずかに」異なるだけで実行時間が大幅に異なる場合があります。 .

したがって、私の質問(上記のすべては、「Check Google」によって閉じられるのを避けるためのものでした):

Clojure を使用した大規模なデータ マイニングに関する優れたリソースは何ですか?

ありがとう!

4

2 に答える 2

13

私は誰もまだ良い包括的なリファレンスを書いていないと思います。しかし、この分野では確かに多くの作業が行われています (私の会社も含まれています!)。

フォローアップするためのいくつかの興味深いリンク:

  • Storm - Clojure を使用した分散リアルタイム計算. 大規模なデータ マイニングに使用できます。
  • http://www.infoq.com/presentations/Why-Prismatic-Goes-Faster-With-Clojure - Clojure のパフォーマンスと機械学習アプリケーションの最適化に関する興味深いビデオ
  • Incanter - おそらく統計とデータ視覚化のための主要な Clojure ライブラリ
  • Weka - Java 用の非常に包括的なデータ マイニング / 機械学習ライブラリ (したがって、Clojure から直接使用するのは非常に簡単です)
于 2012-06-19T15:42:17.440 に答える
1

2013 年 5 月に出版予定の素晴らしい本があります。Clojure Data Analysis Cookbookです。私はおそらくそれを買うでしょう。

http://www.amazon.co.uk/Clojure-Data-Analysis-Cookbook-ebook/dp/B00BECVV9C/ref=sr_1_1?s=books&ie=UTF8&qid=1360697819&sr=1-1

詳細に

データはどこにでもあり、私たちが行動できる洞察を得ることができることがますます重要になっています。データの分析と収集に Clojure を使用するこの本では、実用的で構造化されたレシピの重要なコレクションを使用して、データから新鮮な洞察と視点を得る方法を示します。

「The Clojure Data Analysis Cookbook」では、データ分析プロセスの各段階のレシピを紹介しています。Web ページからデータをスクレイピングする、データ マイニングを実行する、Web 用のグラフを作成するなど、この本には目の前のタスクに役立つ何かが含まれています。

データを取得してクリーンアップし、分析してインターネットに公開できる便利なグラフに変換する方法を学びます。カバレッジには、データの同時処理、ベイジアン モデリングなどの強力な統計手法の適用、さらには K-means クラスタリング、ニューラル ネットワーク、アソシエーション ルールなどのデータ マイニング アルゴリズムなどの高度なトピックが含まれます。

アプローチ

実用的なヒントが満載の「Clojure Data Analysis Cookbook」は、データ分析のあらゆる側面をカバーする一連のステップバイステップの実際のレシピを通じて、データを十分に活用するのに役立ちます。

この本の対象者

Clojure およびデータ分析の手法とワークフローに関する以前の経験は役に立ちますが、必須ではありません。

于 2013-02-12T19:38:09.603 に答える