実際、私はR + PythonとRPY2を使用してデータを操作し、ggplotを使用して美しいグラフィックを作成しています。PostgreSQLデータベースにいくつかのデータがあり、psycopg2を使用してデータをクエリしています。
私は論文を始めていますが、将来的には、(非常に大きな)シミュレーションデータ(多次元、集計クエリなど)を格納するためのOLAPキューブが必要になります。
Python(Python + R、Javaのjpivotやその他のダッシュボードは必要ありません)とMondrianのようなOLAPエンジンとのインターフェースに関するベストプラクティスまたは標準プラクティスはありますか?Googleで解決策を検索しましたが、何も見つかりませんでした。
SQLAlchemyとDjango-ORMを簡単に評価しましたが、OLAPサーバー(Mondrianまたはその他)にクエリを実行するためのMDXまたはXML/Aインターフェイスがありません...
MDXでクエリを記述し、psycopg + ODBCを使用して、OLAPサーバーにクエリを実行し、OLAPサーバーからシミュレーションデータからの回答を得ることができますか(Pythonオブジェクトへのマッピングはありませんが、問題ありません)。
アップデート1:
OLAP + Mondrianテクノロジを検索する必要があるのはなぜですか?
Laval大学( GeoSoa departements + Thierry Badard)がOLAP:SOLAPの空間拡張を作成し、これをGeoMondrianとしてMondrianに実装したためです。私は空間マルチエージェントベースのシミュレーション(〜=ジオシミュレーション)に取り組んでいるので、それは私に興味を持っています。
GeoSoa部門は、GeoMondrian:SOLAPLAYERSと空間データを通信および視覚化するためのAjaxベースのコンポーネントを作成しました。これは、XlmaサーブレットによってMondrianサーバーにクエリを実行できます。
問題:おそらくビッグデータの操作が遅い、インターネットまたはApache2が必要分析、ランクテールなど。ここで、SOLAPは、この後の複雑なR分析のためのデータを準備するのに役立ちます。
なぜPythonなのか?
1-空間データへのWebアクセス-
GeoDjangoやMapFishのような「クールな」Pythonフレームワークを使用しようとしています。GISの大きなコミュニティ、オープンソース、GeoAlchemyを使用した空間クエリ/データの操作、JavaScript拡張機能やOpenLayersによる視覚化などです。
2-GISの空間データへのローカルアクセス-
データにアクセスして視覚化するためのプラグイン(オープンソースGIS)、およびQGISプラグインとAPI=Pythonを作成したいと思います。
3-データの自動分析-
ユーザーまたは科学者は、グリッドコンピューティングを使用してシミュレーションを実行し、このデータに対して実行する自動分析(R + ggplot2 + MDXクエリ)を選択します。ここでの私の目標は、シミュレーションの総合的なレポート(グラフィック、表形式のデータなど)を作成することです。
したがって、シミュレーション後、データはOLAP / SOLAPキューブに送られ、多くのPythonスクリプト(ユーザーが作成)はMDXでデータを取得し、R + RPY2でデータを操作し、doku-wikiなどで科学者のためにクールな出力を作成して生成しますコミュニティプラットフォーム。
問題?
1-外部コンポーネントと通信するためのMondrianのAPIコアであるOlap4jは、Java製です:/
2-SOLAPLAYERSはAjaxを使用してデータにアクセスしますが、私には遅すぎます。
3-SQLAlchemyとGeoAlchemyには、多次元データベース(OLAP)へのドライバー接続がありません。
* 解決?*
1-Pythonを使用してolap4jのJavaオブジェクトまたはJavaコレクションにアクセスするためのPy4j?Javaマップコレクションにアクセスするための独自の関数を作成しますか?=>危険で、それほど簡単ではありませんか?..。
2-Ajax Mondrianサーバーを使用したXLMA?遅すぎます。
3-自分のpy-connectorをOLAPMondrianに書き込みますか?=>痛い。難しい方法だと思います。
私は何をすべきか?