2

私は最近 Elixir を使い始めましたが、いくつかのパターンはデータ サイエンス プロジェクトで広く使用されている Python を思い出させます。たとえば、内包表記や無名関数をリストします。

Elixir の高いパフォーマンスと、複数のプロセスを実行し、非同期タスクを処理する機能を考慮すると、Elixir はデータ サイエンス プロジェクトに非常に適していると思います。

ポイントがありませんか?誰かがこれを経験していますか?

4

2 に答える 2

8

私は、仕事に適したツールを使用することを支持しています。通常、データ サイエンスを行うには次の 2 つの要件があります。

  • ライブラリ (隅々まで車輪を再発明したくないため)
  • パフォーマンス (特に大量のデータを扱う場合)

Python と R は適切なツールです。高品質のライブラリを最も多く提供しており、それ自体は低速ですが、C や Fortran などの高速な言語で記述および最適化されたライブラリのおかげで、優れたパフォーマンスを発揮します。

Julia や Scala などの代替が好きな人もいます。これらはそれ自体がより高速な言語であり、適切な量のライブラリがありますが、適切なライブラリが Python や R で利用可能で、Julia や Scala では利用できない状況に遭遇する可能性があります。

Elixir のような言語では、ほとんどの場合、自分で作業できます。データ サイエンスに特化したライブラリの数は限られています。Elixir コミュニティは、素晴らしいものではありますが、主に分散コンピューティングと Web 開発に焦点を当てているため、そこに多くのサポートを当てにしないでください。

要するに、できますか?技術的にはそうです。実験に害はありませんが、あなたの人生を著しく困難にしています。

一般に信じられていることとは反対に、Elixir は単一スレッドのパフォーマンスに関しては高速な言語ではないことにも注意してください。目の前のタスクによっては、Ruby が同じか、場合によってはさらに高速であることがわかります。

誤解しないでほしいのですが、Elixir は素晴らしい言語であり、それが最も得意とするところは驚くべきものです。ただ、数学的計算のために最初に手を差し伸べる種類の言語ではないというだけです。

于 2017-11-21T19:00:54.217 に答える
2

データサイエンスは非常に幅広いトピックであり、多くのことが関係しています。エリクサーでデータサイエンスを実行できることは確かですが、他のツールのように特定のことをうまく実行できない可能性があることを2セント追加したいと思いますが、かなり遠くまで行くことができますデータのクリーニングとデータのフォーマットには elixir を使用しています。

他にも elixir/erlang https://moz.com/devblog/moz-analytics-db-free/でデータ関連の作業を行っている人がいて、erlang で MapReduce ジョブを実行できるディスコがあり ます https://github. com/discoproject/ディスコ

于 2016-03-02T12:15:14.343 に答える