Equivalent of mongo#39;s out:reduce option in hadoop(等效于 mongo 的 out:reduce 选项在 hadoop)
问题描述
我正在重写一个 MongoDB map reduce 作业以使用 Hadoop(使用 mongo-hadoop 连接器),但是当我将两个数据集映射到同一个集合时,它会覆盖值而不是使用它们
I'm rewriting a MongoDB map reduce job to use Hadoop instead (using the mongo-hadoop connector), but when I map two datasets to the same collection, it overwrites the values instead of using them
{ reduce : "collectionName" } - 如果结果集中和旧集合中的给定键存在文档,则将对这两个值执行归约操作(使用指定的归约函数),并且结果将被写入输出集合.如果提供了 finalize 函数,这也将在 reduce 之后运行.
如何使用 mongo-hadoop?
How is done using mongo-hadoop?
推荐答案
对于正在寻找此功能的其他人,即将支持多输入.
To anyone else looking for this, support for multiple input is coming soon.
更改的分支位于这里.它做得很好,我们正在生产中使用它.
The branch with the change is located here. It's pretty well done, we're using it in production.
这篇关于等效于 mongo 的 out:reduce 选项在 hadoop的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:等效于 mongo 的 out:reduce 选项在 hadoop
基础教程推荐
- 无法使用修饰符“public final"访问 java.util.Ha 2022-01-01
- Java Keytool 导入证书后出错,"keytool error: java.io.FileNotFoundException &拒绝访问" 2022-01-01
- 减少 JVM 暂停时间 >1 秒使用 UseConcMarkSweepGC 2022-01-01
- FirebaseListAdapter 不推送聊天应用程序的单个项目 - Firebase-Ui 3.1 2022-01-01
- “未找到匹配项"使用 matcher 的 group 方法时 2022-01-01
- 设置 bean 时出现 Nullpointerexception 2022-01-01
- Java:带有char数组的println给出乱码 2022-01-01
- 如何使用 Java 创建 X509 证书? 2022-01-01
- 在 Libgdx 中处理屏幕的正确方法 2022-01-01
- 降序排序:Java Map 2022-01-01