問題タブ [fastparquet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dask - Dask ワーカーがタスクの逆シリアル化に失敗する
das クラスターに新しいノードを追加し、conda を使用してすべての依存関係をインストールしました。インストールは、すべての dask ノードでパッケージとバージョンの点で類似しています。
ただし、新しいノードでのタスクは次のエラーで失敗します:
[ worker .... ] : distributed.worker - 警告 - タスクを逆シリアル化できませんでした
他のすべてのノードは正常に動作します。参考までに: すべてのノードに高速な寄木細工がインストールされています。
何か不足している場合はお知らせください。
dask - dask.dataframe.to_parquet をデバッグする正しい理由
to_parquet
関数を実行すると、列オブジェクトの型に問題があることがわかりました。dask バージョン 15.1 を実行しています。
astype(object)を使用して列を明示的に変換しました。これは、一部の列では役立ちましたが、すべてではありませんでした。
次のエラーが表示されます - TypeError: bad argument type for built-in operation
。
パラメータを追加した後object_encoding='utf-8
、次のエラーが発生します - TypeError: expected list of bytes
。
この問題をデバッグする最善の方法は何ですか?
ところで、私のデータセットにはヘブライ文字が含まれています。
どうも