大数据的火爆是不争的事实,然而,市场却依旧在观望……
2011年,IT界一个非常流行的词无疑是“大数据”,最为人熟知的大数据技术是采用大规模并行处理的方式来分析。将负载切割成更小的任务然后并行处理的方式,从本质上而言,并非是什么新想法,Forrester Research分析师表示,大数据意味着规模极大的分析量,意味着高速处理批比特,(千万亿字节)的结构化数据以及非结构化数据的能力。
在过去的10年中,这一技术被谷歌和雅虎发扬光大。首先是谷歌推出了MapReduce构架,能够处理其收集的规模庞大的超乎想象的点击数据,然后是雅虎建立一个采用MapReduce的软件基础架构Hadoop,并且将之开源。
Hadoop风靡
业界对于Hadoop的需求无疑是巨大的,这一点可以从2011年IT厂商发布的基于Hadoop的产品数量看出来。
5月份,IBM发布了一款分析产品——Biglnsights,其中就采用了Hadoop技术;再就是EMC宣布将Hadoop整合到其Greenplum数据仓库设备中;6月份,雅虎拆分了其Hadoop中心并将其独立运营,新公司的名字叫Horton Works;10月份,微软宣布了与HortonWorks公司建立合作伙伴关系,为其数据库平台研发Hadoop相关产品;另外,10月份,甲骨文公司推出了其数据库设备——一种预先集成的软件以及硬件堆栈,其中包括Hadoop版本;同时,在该年度,基于Hadoop的新创公司如CloudEra和MapR持续吸引着风险投资基金的关注。
Hadoop并非大数据这把大伞下唯一受宠的技术。其它还包括比如——纵列数据库,该技术以“纵列”而非以“横排”的方式组织数据。2011年2月,Hewlett-Packard收购了纵列数据技术新创公司Vertica,由此重启了其商务智能战略。同时,SAP将HANA纳入了其创新战略中。HANA是一个纵列数据库平台,采用了2010年被SAP收购的Sybase的技术。
市场处于预热与观望期
从上文可知,现在有大量的大数据技术可供选择。然而,市场真的需要它们么?
当数据的产生是毫无章法而且是不拘泥于时段,并非像以往那样定期更新一个单一的记录,传统的数据
2011年,IT界一个非常流行的词无疑是“大数据”,最为人熟知的大数据技术是采用大规模并行处理的方式来分析。将负载切割成更小的任务然后并行处理的方式,从本质上而言,并非是什么新想法,Forrester Research分析师表示,大数据意味着规模极大的分析量,意味着高速处理批比特,(千万亿字节)的结构化数据以及非结构化数据的能力。
在过去的10年中,这一技术被谷歌和雅虎发扬光大。首先是谷歌推出了MapReduce构架,能够处理其收集的规模庞大的超乎想象的点击数据,然后是雅虎建立一个采用MapReduce的软件基础架构Hadoop,并且将之开源。
Hadoop风靡
业界对于Hadoop的需求无疑是巨大的,这一点可以从2011年IT厂商发布的基于Hadoop的产品数量看出来。
5月份,IBM发布了一款分析产品——Biglnsights,其中就采用了Hadoop技术;再就是EMC宣布将Hadoop整合到其Greenplum数据仓库设备中;6月份,雅虎拆分了其Hadoop中心并将其独立运营,新公司的名字叫Horton Works;10月份,微软宣布了与HortonWorks公司建立合作伙伴关系,为其数据库平台研发Hadoop相关产品;另外,10月份,甲骨文公司推出了其数据库设备——一种预先集成的软件以及硬件堆栈,其中包括Hadoop版本;同时,在该年度,基于Hadoop的新创公司如CloudEra和MapR持续吸引着风险投资基金的关注。
Hadoop并非大数据这把大伞下唯一受宠的技术。其它还包括比如——纵列数据库,该技术以“纵列”而非以“横排”的方式组织数据。2011年2月,Hewlett-Packard收购了纵列数据技术新创公司Vertica,由此重启了其商务智能战略。同时,SAP将HANA纳入了其创新战略中。HANA是一个纵列数据库平台,采用了2010年被SAP收购的Sybase的技术。
市场处于预热与观望期
从上文可知,现在有大量的大数据技术可供选择。然而,市场真的需要它们么?
当数据的产生是毫无章法而且是不拘泥于时段,并非像以往那样定期更新一个单一的记录,传统的数据
