データセットの統計を計算する必要がある Web アプリを構築しています。パーセンタイル、平均、モード、および配列のその他の統計関数を計算する必要があります。
通常、Python では、stat 配列関数の膨大なライブラリを持つ scipy、numpy、または nltk を使用します。これを行うために利用できるルビーの宝石やライブラリはありますか?
既存のライブラリがない場合、Ruby/Rails でアプリを維持しながら Python でデータ処理を行う簡単な方法はありますか?
データセットの統計を計算する必要がある Web アプリを構築しています。パーセンタイル、平均、モード、および配列のその他の統計関数を計算する必要があります。
通常、Python では、stat 配列関数の膨大なライブラリを持つ scipy、numpy、または nltk を使用します。これを行うために利用できるルビーの宝石やライブラリはありますか?
既存のライブラリがない場合、Ruby/Rails でアプリを維持しながら Python でデータ処理を行う簡単な方法はありますか?
完全な統計ライブラリが本当に必要な場合は、statsampleをご覧ください。それ以外の場合は、descriptive_statisticsが優れた軽量の代替手段であることに気付くかもしれません。
JRuby で統計を行う新しい Gem - MDArray を実装しました。JRuby は基本的に Java であるため、これは実際には Web アプリケーションには非常に適しているかもしれません。MDArray は NArray と Numpy の哲学に従っており、現時点ではどちらよりも遅いかもしれませんが、純粋な Ruby の代替よりは速いはずです。
確認してください。何か助けが必要な場合は、喜んでお手伝いします。
乾杯、
ロドリゴ
NumPy に似た数値ライブラリであるNMatrixを継続的な開発で使用できます。(免責事項: 私は SciRuby/NMatrix チームの一員です)
ActiveRecord モデルで統計を計算している場合は、おそらく統計ジェムを確認することをお勧めします。
また、コンソールで使用するための GNU-R 統合とSIRBを提供するstatisticusをブックマークしました。
Rails アプリで Python を実行する方法は無数にありますが、Ruby ライブラリで必要なメソッドを見つける方がおそらく簡単です。