問題タブ [dask-ml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
186 参照

python - タブと改行文字で区切られたデータ文字列から dask データフレームを作成する方法

データは、\ 文字 (列の場合) と行の改行 \n 文字で区切られた文字列の形式になっています。

Dask.array.from_array() は入力として配列のみをサポートしているようです。

を使用して上記のテキストを np.array に変換できますが

文字列をダスク配列またはデータフレームに直接変換するのに相当するものがあるかどうか疑問に思っています。

0 投票する
1 に答える
554 参照

python - train_test_split - チャンク サイズが不明な Dask 配列では操作できません

ディスク容量を節約するために dask parquet を使用したテキスト分類データセットがありますが、データセットをトレーニングに分割し、dask_ml.model_selection.train_test_split.

その結果 TypeError: Cannot operate on Dask array with unknown chunk sizes.

助けてくれてありがとう。