問題タブ [dask-ml]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - タブと改行文字で区切られたデータ文字列から dask データフレームを作成する方法
データは、\ 文字 (列の場合) と行の改行 \n 文字で区切られた文字列の形式になっています。
Dask.array.from_array() は入力として配列のみをサポートしているようです。
を使用して上記のテキストを np.array に変換できますが
文字列をダスク配列またはデータフレームに直接変換するのに相当するものがあるかどうか疑問に思っています。
python - train_test_split - チャンク サイズが不明な Dask 配列では操作できません
ディスク容量を節約するために dask parquet を使用したテキスト分類データセットがありますが、データセットをトレーニングに分割し、dask_ml.model_selection.train_test_split
.
その結果
TypeError: Cannot operate on Dask array with unknown chunk sizes.
助けてくれてありがとう。