問題タブ [pyarrow]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

715 問題

0 投票する

1 に答える

9431 参照

python - pyarrow の使用時に libhdfs をロードできない

Pyarrow 経由で HDFS に接続しようとしていますが、libhdfsライブラリを読み込めないため機能しません。

libhdfs.soと$HADOOP_HOME/lib/native同様にあり$ARROW_LIBHDFS_DIRます。

私が得ているエラー：

2018-10-31T16:11:20.007

0 投票する

2 に答える

1882 参照

python - PyArrowを使用してs3から寄木細工ファイルの定義されたリストを読み取る方法は?

s3 に保存されている Parquet ファイルから Pandas にデータを段階的に読み込む必要があります。これには PyArrow を使用しようとしていますが、うまくいきません。

Parquet ファイルのディレクトリ全体を Pandas に書き込むと、問題なく動作します。

しかし、単一の Parquet ファイルを読み込もうとすると、エラーが発生します。

エラーをスローします:

このエラーに関するヘルプをいただければ幸いです。

理想的には、s3 に追加されたすべての新しいデータ (前回このスクリプトを実行してから追加されたもの) を Pandas データフレームに追加する必要があるため、ファイル名のリストを ParquetDataset に渡すことを考えていました。これを達成するためのより良い方法はありますか？ありがとう

python parquet pyarrow

2018-11-03T15:23:09.970

0 投票する

1 に答える

109 参照

c++ - arrow::MemoryMappedFile のメモリに直接アクセスできますか?

開発者の方へ、私は arrow::MemoryMappedFile を使用しており、データのコピーを作成する代わりに、直接アクセスしたいと考えています。メモリ内のこのデータにアクセスする方法はありますか?

ありがとう、マーク

c++memory-mapped-files pyarrow

2018-11-06T17:04:41.483

1 2 3 4 5 6 7 8 9 10

問題タブ [pyarrow]

python - pyarrow の使用時に libhdfs をロードできない

python - PyArrowを使用してs3から寄木細工ファイルの定義されたリストを読み取る方法は?

c++ - arrow::MemoryMappedFile のメモリに直接アクセスできますか?

Reference