1

Spark mongo-connector を使用して、mongodb コレクションから hdfs ファイルにデータを同期します。コレクションが mongos を介して読み取られる場合、私のコードは正常に動作しますが、local.oplog.rs に関しては、レプリカ コレクションは mongod を介してのみ読み取ることができます。私に例外を与えます:

原因: com.mongodb.hadoop.splitter.SplitFailedException: 入力分割を計算できません: 分割キー上のインデックスが見つかりませんでした { _id: 1 }

oplog.rs と通常のコレクションではデータ構造が違うと思いますが、oplog.rs には「_id」プロパティがないため、newAPIHadoopRDD は正常に動作しません。

4

1 に答える 1