刚接触hadoop，关于完全分布式环境下数据处理的问题。

jack

发布于
2016-11-16

是这样的，在hadoop完全分布式环境下，有一个主节点和两个从节点，我想处理一个很大的数据文件，因为我们有两个从节点，可以通过mapreduce编写程序把数据分成两部分然后分别让每个节点去处理，最后在输出数据？

hadoop hdfs mapreduce

阅读 2.9k

1 个回答

发布于
2016-11-18

✓ 已被采纳

那样就失去大数据组件的意义了，你只需要直接把数据上传，hadoop自己会决定由谁来执行计算，不需要人为写代码。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

二进制文件或者视频、音频、文档文件如何写入数据湖，如何使用？
关于数据湖的存储数据都说支持各类型数据，如结构化、非结构化、二进制等等但是很多案例或者demo都是做实时数据或者离线数据处理，感觉和以前用kafka，hive用法差不多没有看到具体怎么将视频或者图片或者pdf文件等等这类数据写入数据湖有没有大佬有相关示例或者介绍下这类数据入湖的思路hudi、iceberg都可以，有具体示例...
1 回答3.9k 阅读

相似问题

找不到问题？创建新问题