2

最近调研了一下美国的大数据创业公司,总结如下,如有疏漏,欢迎反馈指正(boyang798@gmail.com)。

公司 成立时间 技术亮点 IPO或者收购
hortonworks.com June, 2011 三大主要Hadoop平台提供商之一, 提供Windows平台Hadoop支持 IPO,Dec 11, 2014
cloudera.com October, 2008 三大主要Hadoop平台提供商之一, 用户基数最大的Hadoop平台
mapr.com July, 2009 三大主要Hadoop平台提供商之一, 实现自己的Linux文件系统来提升Hadoop速度
databricks.com September,2013 创立Apache Spark,提升Hadoop速度10倍,同时提供优于MapReduce的编程模型
datameer.com September, 2009 提供端到端(从数据收集到数据可视化)的一站式大数据分析平台
palantir.com January, 2004 自有技术,着重于非机构化数据深度分析,初期以政府客户为主,后扩展到银行和金融领域
splunk.com October, 2003 大规模机器数据(日志)收集,存储,可视化分析 IPO,Apr 19, 2012
vertica.com May, 2005 基于列存储的数据库技术,提升数据仓库查询速度,注重MPP(massively parallel processing),企业级Hadoop方案和SQL on Hadoop 被Hewlett-Packard收购,February 14, 2011
autonomy.com January, 1996 自有非Hadoop大数据技术,非主流技术,但是比较有特色 被Hewlett-Packard收购,August 18, 2011,但是被业界认为是HP的一个失败收购案例
teradata.com July, 1979 老牌传统数据仓库提供商,收购Aster提供MPP技术平台,同时扩展业务到Hadoop平台 December 1991被NCR收购,之后又由NCR公司剥离,作为单独的上市公司,Oct 5, 2007
jaspersoft.com June, 2001 侧重于商务数据分析报表,提供移动端的报表工具 被TIBCO Software收购,April 28, 2014
karmasphere.com April, 2010 基于Hadoop的解决方案和数据可视化分析 被FICO收购,April 2014
domo.com October, 2010 提供数据分析云服务平台
talend.com September, 2005 提供多种数据集成服务
qubole.com December, 2014 提供Hadoop云平台服务
treasuredata.com December, 2011 提供大数据存储,查询,分析云服务
platfora.com June, 2011 端到端一站式大数据平台解决方案,基于Hadoop和Spark
interana.com January, 2013 自服务数据分析平台,侧重于面向事件的数据
gridgain.com May, 2005 基于内存的大数据实时处理系统
metamarkets.com May, 2010 在线广告领域内数据实时处理分析平台
pivotal.io April, 2013 大数据集成产品,提供Hadoop,内存Non-SQL数据库,RabbitMQ,以及Greenplum MPP(massively parallel processing)等多种服务
fiscalnote.com April, 2013 使用大数据和人工智能技术预测立法机构的投票结果
dato.com May, 2013 专注于机器学习的数据处理平台,非hadoop技术,底层用C++实现,从GraphLab(graph based framework)发展而来

除了以上大数据公司外,还有很多各具特色的公司,比如专门提供Non-SQL数据库的公司:

Non-SQL数据库 公司
Cassandra datastax.com
MongoDB mongodb.com
Couchbase couchbase.com
FoundationDB foundationdb.com

其它还有很多提供商务数据分析,可视化报表,大数据平台的公司,就不详细例举了,包括:Tableau, GoodData, ZoomData, SpagoBI, Pentaho, Eclipse BIRT, birst, netezza, paraccel, Ayasdi, Trifecta, Clearstory, Alpine Data Labs, Altiscale, Trifacta, Splice Machine, DataTorrent, Continuuity, Xplenty, Aerospike, snowflake.net, SumAll, Tamr, wibidata


从对美国大数据市场的调研来看,我们可以得到一些启示:

  1. 美国的数据分析市场非常大,容纳超过30家公司,这得益于美国信息化的高度发达。

  2. 虽然有很多公司,但是大家很少有重复竞争,每一家都有自己的特色,在自己的领域内发展,这也符合美国公司注重差异化相关。

  3. 传统的商务数据分析公司在维持旧有客户和平台的情况下,在积极向大数据技术扩展。

  4. 新兴的大数据技术发展非常快,但是目前还没有到成熟阶段,除了Hadoop之外,没有其他统一的技术被各家公司采用。

  5. 新的大数据技术趋势是快速响应,开始追求数据的实时处理和快速查询。


相对于美国市场,中国的大数据市场还处于非常初期的阶段,这可能跟中国的信息化程度相关。做长期展望预测,如果中国的信息化发展到美国的阶段,并且公司普遍采用基于数据的量化决策机制,将会迎来一个大数据发展的爆发式增长。

扫描微信二维码联系作者
扫描微信二维码联系作者


BoYang
132 声望9 粉丝

Big Data, SQL on Hadoop