問題タブ [apache-arrow]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pyarrow の使用時に libhdfs をロードできない
Pyarrow 経由で HDFS に接続しようとしていますが、libhdfs
ライブラリを読み込めないため機能しません。
libhdfs.so
と$HADOOP_HOME/lib/native
同様にあり$ARROW_LIBHDFS_DIR
ます。
私が得ているエラー:
apache-drill - Apache Drill の ValueVectors と Apache Arrow の違いは何ですか?
Apache Drill には、Apache Arrow のような独自の円柱表現があります。しかし、Apache Arrow はより多くのプログラミング言語をサポートしています。Apache Drill を使用することを楽しみにしていますが、それでも Apache Arrow のプログラミング言語サポートが必要です。
一部の情報筋によると、Apache Arrow は Apache Drill の ValueVectors にルーツがあります。
Drill は、MongoDB や Elasticsearch と同様に、データを JSON ドキュメントとして内部的に表現します。これらの JSON ドキュメントは列に「細分化」されるため、Drill は列分析のパフォーマンスを向上させながら、複雑なデータをクエリする機能を維持できます。この内部表現は Apache Arrow に基づいていないことに注意してください。-ソース
Apache Drill が Apache Arrow プロジェクトを利用できないのはなぜですか? Drill の内部表現は Apache Arrow とどのように異なり、Arrow には Drill の ValueVectors よりも優れている点とその逆の利点があります。