scala - キーによる Spark パーティション

翻译自：https://stackoverflow.com/questions/35553077 2016-02-22T11:59:36.537

100 次

Spark の 2 つのタイプのパーティションの違いは何ですか?

例: テキストファイル toto.csv をディスクから Spark クラスターに読み込みます。

val text = sc.textFile("toto.csv", 100)

=>「ルール」なしでファイルを100個のフラグメントに分割しました

その後、私が行う場合

val partion = text.partitionBy(new HashPartitioner(100))

=>ファイルをキーで100個のパーティションに「分割」しました

確認または提案に感謝します

0 に答える 0