大数据 论文

2015-01-29
阅读 7 分钟
3.4k
Papers Published in 2014 Published in 2013 Published in 2012 Published in 2011 Published in 2010 Published in 2009 Published in 2008 Published in 2007 Published in 2006 Published in 2005 Published in 2004 Published in 2003 Published in 2002 Published in 2001 Published in 2000 Published in 1999 Pu...

Big Data Ecosystem Dataset

2015-01-29
阅读 28 分钟
10.7k
Big Data Ecosystem Dataset Data Projects Frameworks Distributed Programming Distributed Filesystem Key-Map Data Model Document Data Model Key-value Data Model Graph Data Model NewSQL Databases Columnar Databases Time-Series Databases SQL-like processing Integrated Development Environments Data In...

scala 实现 hadoop 多重文件输出

2015-01-27
阅读 5 分钟
4.6k
{代码...}

linux+hadoop 权限管理

2014-12-16
阅读 2 分钟
4.2k
hadoop体系权限 {代码...} linux 添加组和 用户 创建组 {代码...} 新用户加入组 {代码...} 老用户加入另外一个组 {代码...} 删除组

oozie 失败重试和报警

2014-12-11
阅读 1 分钟
5.6k
配置重试 {代码...} 添加失败报警 {代码...} 参考

Hadoop参数汇总

2014-10-05
阅读 25 分钟
37.8k
Hadoop参数汇总 @(hadoop)[配置] linux参数 以下参数最好优化一下: 文件描述符ulimit -n 用户最大进程 nproc (hbase需要 hbse book) 关闭swap分区 设置合理的预读取缓冲区 Linux的内核的IO调度器 JVM参数 JVM方面的优化项Hadoop Performance Tuning Guide Hadoop参数大全 {代码...} 主要配置文件: core hdfs yarn ma...

idea hadoop 开发环境

2014-08-17
阅读 1 分钟
5k
最近自己搭建了一个小群集整理了下hadoop的开发环境 构建项目 构建的时候选择maven项目 maven的配置 [链接] 编译 编译的时候用了maven-assembly-plugin 插件可以直接打包成依赖包 运行 copy 文件到hadoop群集机器之后 {代码...} 代码 整个测试的代码在[链接]

CDH5 安装相关问题

2014-07-13
阅读 3 分钟
4.6k
CDH5 相关 安装 安装manager {代码...} 修改环境变量 {代码...} cat /proc/version 镜像源 {代码...} 数据库 CDH 使用 postgres 作为数据存储 root 密码 password {代码...} 数据库 {代码...} 连接数据库psql -U scm -W -h 127.0.0.1 -p 7432 scm 密码见上面问题的配置 部分命令和 mysql 的区别 {代码...} 如果不能访问...