問題タブ [pyarrow]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

715 問題

0 投票する

1 に答える

227 参照

python - pyarrow を使用した消費者と生産者のパターン

pandas データフレームの高速メモリストアとして pyarrow を使用して、マルチプロセスベースのコンシューマープロデューサーパターンを実装する最良の方法は何ですか?

現在、私は redis pub sub を使用していますが、より効率的な (より高速な) ソリューションがあると思いますか? 例を挙げていただけますか？

2018-07-22T12:51:40.533

0 投票する

2 に答える

2369 参照

pandas - Python pandas_udf スパークエラー

私はローカルでスパークをいじり始め、この奇妙な問題を見つけました

ここからこの例を取るhttps://databricks.com/blog/2017/10/30/introducing-vectorized-udfs-for-pyspark.html

このエラーが発生し続ける理由は何ですか?

pandas apache-spark pyspark pyarrow

2018-08-06T18:33:25.237

0 投票する

0 に答える

251 参照

python - pyarrow を使用して Amazon S3 で寄木細工ファイルを開く際のエラー

S3に保存されている寄木細工のファイルから単一の列データを読み取ることになっている次のコードがあります。 fs = s3fs.S3FileSystem() data_set = pq.ParquetDataset(f"s3://{bucket}/{key}", filesystem=fs) column_data = data_set.read(columns=[col_name])

そして、私はこの例外を取得します: validate_schemas self.schema = self.pieces[0].get_metadata(open_file).schema IndexError: list index out of range

pyarrow の最新バージョンにアップグレードしましたが、役に立ちませんでした

python amazon-s3 parquet pyarrow

2018-08-28T12:29:34.857

0 投票する

2 に答える

3039 参照

python - S3のpyarrowでparquetファイルを上書きする

S3 にある pyarrow で寄木細工のファイルを上書きしようとしています。ドキュメントを見ましたが、何も見つかりませんでした。

これが私のコードです：

mode = "overwrite"write_to_dataset 関数にオプションのようなものはありますか?

python amazon-s3 pyarrow python-s3fs

2018-08-30T11:22:40.793

1 2 3 4 5 6 7 8 9 10

問題タブ [pyarrow]

python - pyarrow を使用した消費者と生産者のパターン

pandas - Python pandas_udf スパーク エラー

python - pyarrow を使用して Amazon S3 で寄木細工ファイルを開く際のエラー

python - S3のpyarrowでparquetファイルを上書きする

Reference

pandas - Python pandas_udf スパークエラー