让大数据“说人话”
近年来,各行各业随处皆言“大数据”。然而,目前人们关于大数据价值的讨论大多仍停留在宏观层面,如何在大数据环境下挖掘出有价值的信息和规律,需要极大的计算量。尽管通过硬件的提升可以使对数据的计算获得更快速度,但这样的平台同样需要软件来支撑。
分布式计算提供了一个解决方案。事实上,云计算就是在分布式计算(更进一步是网格计算)基础上发展起来的。目前,分布式计算最基础、最常用的编程软件非Hadoop莫属,因此,基于Hadoop开放、可信的数据处理平台,广为数据分析用户所青睐。
Cloudera就是这样一家Hadoop数据管理软件与服务提供商。12月10日,成立不到7年就成长为业界翘楚的Cloudera正式宣布,其分公司在中国“开张”。这标志着这家已在全球发展了1300多家客户的大数据公司,开始将业务触角伸向对大数据解决方案需求潜力巨大的中国市场。
Cloudera中国公司名为肯睿(上海)软件有限公司,其登陆中国市场将致力于唤醒沉睡在企业大数据中的商业规律,从而帮助企业通过大数据处理和分析加速洞察业务的获取效率。
今年3月,英特尔宣布再次向Cloudera注资,总投资额增至7.4亿美元,持股比例达到18%,成为Cloudera最大的战略股东。与英特尔公司的合作使得人们对这家初入中国市场的公司有着更高期盼。
Cloudera公司创始人之一、首席执行官兼首席战略官迈克奥尔森专程飞临中国为新公司站台。《中国科学报》记者近日在Cloudera于北京举办的首场媒体见面会上见到他以及Cloudera 全球副总裁、大中国区首任总经理凌琦,深度了解了Cloudera在中国区的战略部署和大数据解决方案。
“英特尔的硬件和Cloudera大数据的软件的联手,会给最终客户带来更好的产品。”奥尔森介绍,Cloudera最新发布的5.3版本“百分之百开源和符合开放式标准”,是目前市场上功能最强大、安全的大数据平台。
凌琦告诉记者,英特尔投资Cloudera之后,将其Hadoop部分的业务和Cloudera的产品合并起来,作为产品团队的基础。“Cloudera虽然在中国刚刚落地,但以此为基础的团队在过去3年间在大数据、Hadoop领域积累了足够经验。”
英特尔方面也给出了回应。英特尔中国研究院院长吴甘沙在相关活动中谈及,英特尔与Cloudera双方将一起推动基于Hadoop的开放、雷火竞技入口可信的数据处理平台,推动整个生态环境的基础创新,“希望把高级的分析功能平民化,迈入主流应用”,目标就是“让大数据说人话”。
成立于2008年的Cloudera现已成为全球最大的基于Hadoop的发行提供商,在全球拥有很多合作伙伴和终端用户。今年高调入驻中国,Cloudera高层口径一致,宣称要和中国的合作伙伴一起“把最好的大数据服务带进中国”。
“中国拥有巨大的商业潜力,在大数据潮流下,拥有庞大人口的中国势必拥有巨大的机会,这些机会在全球其他任何地方很难看到。”奥尔森毫不讳言,Cloudera在全球拥有包括电信运营商、金融、零售、制造等各行各业的客户,这些服务经验将为“深挖”中国市场提供借鉴,“数据可以方便地导入到数据管理平台,借助高级分析工具对客户数据进行深度挖掘,同时还可以建立更多的上层应用,以提供更多商业价值”。
目前中国多地在智慧城市建设方面暗自发力,雷火竞技入口金融、电信、交通、新药研发、医疗信息化等领域的大数据管理与分析需求巨大。
Cloudera的中国战略是“用本地的支持团队和商业模式服务本地客户”。凌琦介绍说,目前,Cloudera大中国区在北京、上海、广州设有分支机构,“肯睿是由中国领导团队和技术团队组成的本地公司,可以更好地服务中国客户和合作伙伴。”
“针对中国的需求进行开发和支持,我们有两个方向:利用大数据使企业运作成本更低,以及挖掘大数据的价值使企业发展更快。”凌琦认为,尽管过去人们常谈大数据,但真正的大数据时代才刚刚开始。
Hadoop平台是Cloudera的业务核心,而“Hadoop之父”、Apache Hadoop社区的发起者和领导者道格卡汀正是Cloudera公司现任首席架构师。奥尔森对Hadoop平台充满信心:“Hadoop平台安全、可靠、成本低、几乎可以无限伸缩,所有数据应用都可以在Hadoop平台上面有很多创新。”
记者了解到,Hadoop的社区环境与10年前的Linux非常类似,是业界主流的操作系统方案。基于Hadoop架构,Cloudera为客户提供了功能强大的管理平台。经过多年发展,Cloudera免费版在国内市场已经占据80%的份额,并有越来越多用户转向收费的商业版本。
面对巨大的中国市场,仅有平台是不够的。凌琦表示,大数据是相对复杂的一项技术,它不仅需要在软硬件平台、行业系统集成架构及应用上分析和挖掘数据,同时还要注重新应用的开发。“大数据需要生态系统,需要培养人才。”
凌琦介绍说,Cloudera迄今为止在全球已经培训了近4万名大数据平台的管理、应用和开发相关人才,并提供培训认证。“我们希望通过培训人才带动中国大数据实施和运用的快速发展。”
Cloudera希望与合作伙伴、用户展开相关的人才培训及认证,同时与大学、研究机构合作,来解决当前大数据人才短缺的难题。
“企业用户也希望得到我们的培训,这不光对企业本身的发展,同时对受培训对象自身的职业发展也有帮助。”凌琦说,Cloudera提供的大数据人才培训及认证是非常有吸引力的,在美国受过大数据认证培训之后的技术人员薪水会得到显著提高。
而与教育机构的合作,凌琦透露,实际上是把材料和培训方法教授给大学,通过讲师培训更多的学生,让学生在走出校园的时候具备大数据开发应用的知识和能力。
Cloudera不仅培训人才,还培训大数据培训师,并引入第三方认证。“培训不仅是为了拓展业务,更重要的是对大数据生态系统的培养。”凌琦说。
关注雷火竞技