用Python跑hadoop,需要指定输出格式和文件名字

现在有个需求,需要用hadoop跑大数据,以前没接触过JAVA计划用Python跑,但是网上的例子都不能指定输出格式和输出的名字
具体需求分为两个需求,一个是将json形式的字符串转换为xxxtxxxtxxx的格式,还需要从json里面某个type字段输出成一行一个以type为名字的文件
谁有解决过,求思路有实际例子更好

阅读 1.6k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题