次のコードを実行すると、dask.dataframe.head() の結果は npartitions に依存します。
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame({'A': [1,2,3], 'B': [2,3,4]})
ddf = dd.from_pandas(df, npartitions = 3)
print(ddf.head())
これにより、次の結果が得られます。
A B
0 1 2
ただし、npartitions を 1 または 2 に設定すると、期待どおりの結果が得られます。
A B
0 1 2
1 2 3
2 3 4
npartitions がデータフレームの長さよりも短いことが重要なようです。これは意図したものですか?