問題タブ [blaze]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
7 に答える
208732 参照

python - Parquet ファイルを Pandas DataFrame に読み込む方法は?

Hadoop や Spark などのクラスター コンピューティング インフラストラクチャをセットアップせずに、適度なサイズの Parquet データセットをメモリ内の Pandas DataFrame に読み込む方法は? これは、ラップトップで単純な Python スクリプトを使用してインメモリで読み取りたいと思う適度な量のデータにすぎません。データは HDFS に存在しません。ローカル ファイル システムまたは S3 にある可能性があります。Hadoop、Hive、Spark などの他のサービスを起動して構成したくありません。

Blaze/Odo ならこれが可能になると思いました。Odo のドキュメントでは Parquet について言及されていますが、例はすべて外部の Hive ランタイムを経由しているようです。

0 投票する
1 に答える
210 参照

python - Python blaze オブジェクトで数値列のみを取得する

blazeこのようなデータオブジェクトがあります

numeric datatypes.For example here onlyidamount数値を持つ列名のみを取得したい。

次のように使用して列の型を取得できdshapeます

しかし、これを適切に利用する方法がわかりません。pandas関数を使用して同じことを行う方法を知ってい_get_numeric_data()ます。で同様の機能またはコードを探していますblaze

0 投票する
2 に答える
423 参照

python - python blazeは複数の列の平均を計算します

私はこのようなPythonブレイズデータを持っています

数値列の平均を計算したいと思います。私はこのようなことを試しました

そして私は得る

のように一発で計算したいのですがpandasdata.mean()

考えや提案はありますか?