Spark

MongoSpark 实现 upsert 操作

Spark 版本: 2.1 通常我们经过各种算得到 RDD,MongoSpark 没有有直接提供 upsert 或 update 的方法,因为保存 RDD使用的是 insertMany的方法。但是 WriteConfig 提供了一个 replaceDocument 的参数,仅对 Dataset 有效,当存在 _id 字段的时候,可以实现 replace 或 upsert 的功能… 阅读更多 »MongoSpark 实现 upsert 操作