問題タブ [fastparquet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
426 参照

dask - Dask ワーカーがタスクの逆シリアル化に失敗する

das クラスターに新しいノードを追加し、conda を使用してすべての依存関係をインストールしました。インストールは、すべての dask ノードでパッケージとバージョンの点で類似しています。

ただし、新しいノードでのタスクは次のエラーで失敗します:

[ worker .... ] : distributed.worker - 警告 - タスクを逆シリアル化できませんでした

他のすべてのノードは正常に動作します。参考までに: すべてのノードに高速な寄木細工がインストールされています。

何か不足している場合はお知らせください。

0 投票する
1 に答える
1356 参照

dask - dask.dataframe.to_parquet をデバッグする正しい理由

to_parquet関数を実行すると、列オブジェクトの型に問題があることがわかりました。dask バージョン 15.1 を実行しています。

astype(object)を使用して列を明示的に変換しました。これは、一部の列では役立ちましたが、すべてではありませんでした。
次のエラーが表示されます - TypeError: bad argument type for built-in operation
パラメータを追加した後object_encoding='utf-8、次のエラーが発生します - TypeError: expected list of bytes

この問題をデバッグする最善の方法は何ですか?
ところで、私のデータセットにはヘブライ文字が含まれています。

どうも