请教:怎么使用mapreduce分析三列数据获取最大值

这三列数据中,第一列数据比如说是客户,第二列的数据都是不相同的,比如说是商品,现在的需求是,怎么通过比较第三列数据(商品销售量)的大小然后找出最大值,得出的最后客户购买最多的商品包括及其对应的销售量。
1,a,2
1,b,12
1,c,56
1,d,3
1,e,4
2,f,12
2,g,9
3,h,5
4,i,78
4,j,96
4,k,54
5,l,32
5,m,18

阅读 3.7k
1 个回答

需要创建对象封装来进行分析,需要对类对象进行implements Writable操作,然后创建对象属性,创建get,set方法,及Writable的重写

过两天我博客补上代码http://tinuer.com/

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进