企业风采
您当前所在位置:首页 > 萍商讲堂

张亚勤:云和大数据

点击数:461 发表时间:2014-04-28

三年前,我 提出了三大平台之争,这是一场注定要旷日持久的争夺战。如今,三大平台之争也进入了新的阶段。

一个平台是云。由于云计算基础设施建设需要巨大的资金投入、长时间、大范围的部署和持续的更新维护,有足够的资源、实力去构建大规模云计算平台的企业并 不多。所以当时我说,纵观全球,也不会有太多的公司有资格成为云平台的掌控者,如今看来,亚马逊、微软、谷歌、Rackspace等少数公司位于一军 团。

第二个平台是智能终端,其本质是iOS、Android和Windows之争。2010年,“移动三国”的竞争才刚开始。转眼间三年过去了,战况是越来越 激烈,而且这场战役还会持续很久。苹果、Google、微软都在设法强化自身的生态系统,微软 近几个月,陆续宣布了Windows 8、Windows Phone 8等一系列新终端平台,目前的市场反响表明,微软的转型是基本成功的。

第三个平台是凌驾于云和端之上的,反映真实关系的社会化商务和社交平台。永不中断的云服务和彼此连接的人群与海量设备,带来的 大机会在于如何以人和数据 为中心,发展出反映真实世界中人与人、人与机器、机器与机器关系的社会化网络,并在其上诞生消弭真实与虚拟界限、更加人性化、交互更自然的商务和社交平 台,以及应用。我们看到,将现实社会关系数字化、网络化、商业化的尝试早已开始。但迄今为止,现实世界数字化的程度还不够,真正超越国别、种族和文化壁垒 的社会化网络的平台仍未建成,这也正是中国IT产业的重大机遇。

显然,三大平台里,云是前提,是基础。过去我讲过很多次,云计算其实在计算量越来越大、数据越来越多、越来越动态、越来越实时、越来越需要结构化的产业背 景下被催生出来的一种基础架构和商业模式。无论是云计算本身、或是智能终端,还是凌驾于云和端之上的,基于社会化网络的平台和应用,都会让数以百亿计的机 器、企业、个人随时随地都在获取和产生新的数据,即使是在摩尔定律的支撑下,计算设备硬件性能进化的速度也早已赶不上数据增长的速度,并且这一问题会日渐 严峻——这样的背景下,只有云才能解决“赋予数据以更大价值”的问题。这也就引出了新的话题,也是 近这段时间产业和社会都非常关注的“大数据”的话题。

 “大数据”的崛起

如今,大数据的重要性越来越明显,但就和云计算一样,它也不是一个从天而降的新概念,而是在三个主要因素的驱动下,逐步成长成熟的。

一个驱动力,就是业界常说的大数据的三个V(Volume, Variety, Velocity),而这三个V可以有多种解读:一个V,巨大的数据量与数据完整性。第二个V,在海量、种类繁多的数据间发现其内在关联。第三个V,可 以理解为更快地满足实时性需求。第二个驱动力,是云计算的普及和成为主流。经常有一些朋友会问我说,云计算和大数据到底有什么区别?前两年大家都在讲云计 算,现在怎么又变成大数据了?其实,云计算和大数据是一个硬币的两面,云计算是大数据的IT基础,而大数据是云计算的一个杀手级应用。由于云计算的普及和 成为主流,让上述三个V不再成为挑战,反而成为大数据成长的驱动力。另一方面由于数据越来越多、越来越复杂、越来越实时,这就更加需要云计算去处理,所以 二者之间是相辅相成的。举例而言,30年前存储1TB数据的成本大约是16亿美元,如今存储到云上只需不到100美元;但存储下来的数据,如果不以云计算 进行挖掘和分析,就只是僵死的数据,没有太大价值。

第三个驱动力,是人工智能、机器学习和数据挖掘等技术的迅速发展。在这样的背景下,微软已经可以为用户提供三个层次的端到端大数据解决方案——其一是数据 管理,即如何获取、存储和保护数据;其二是数据丰富,即如何清洗、发现不同数据间的数据相关性;其三是,数据洞察力,即通过分析、呈现与决策工具,获得洞 察力,并通过付诸行动,产生价值。

通俗的说,就是将信号转化为数据,将数据分析为信息,将信息提炼为知识,以知识促成决策和行动。归根到底,大数据的意义在于获得洞察力和价值,这也正是大数据的第四个V(Value),这个V比前面的三个V都更重要。

 

云和大数据重塑科技和商业生态

不太为人所知的是,云计算和大数据的结合,影响到的是科学研究界。

2007年1月,我在微软的同事、也是我非常尊敬的一位科学家吉姆·格雷(Jim Gray)在计算机科学与电信委员会上的一次演讲中描绘了“科学研究的第四范式”的图景。所谓“第四范式”是指基于数据密集型计算的科学研究——吉姆·格 雷呼吁资助开发用户数据采集、管理和分析的工具,呼吁资助一个交流与发布的基础设施。在他的设想中,数据密集型科学由三个基本活动组成:采集、管理和分 析。数据的源头是各种不同规模和属性的国际科学联盟、实验室甚至于个人生活,需要创建一系列通用工具来支持从数据采集、验证、管理到分析、存储的整个流 程,而数据分析则覆盖整个工作流程的所有环节,包括建立数据库、建模和分析、数据可视化等等。吉姆·格雷的一次演讲体现了这位图灵奖的远见和雄 心。

在商业领域,大数据具备极大的想象空间。

上个世纪七十年代,纽约的治安状况很糟糕。一位名叫杰克•迈普(Jack Maple)的年轻警察根据个人警务经验,发明了一种名为“未来图表”(Charts of the future)的犯罪预测方法论,可以根据过往抢劫案的记录数据来推测新案件可能发生的时间与地点。这种方法真的有效,1994年,新上任的纽约市警察局 局长开发了“未来图表”的电子版,将之更名为“CompStat”,推广至全市的警务系统。CompStat的技术核心是犯罪测绘系统(Crime Mapping System)和数据库采集系统(Database Collection System),而微软的Microsoft MapPoint、Access、Excel等产品为两个系统提供了坚实的支撑——基于大量的数据采撷、挖掘和分析工作,纽约警察局尝试对历史上犯罪分子 的行为规律进行归纳和总结,并有效地改善了城市的治安。数据显示,在CompStat得到推广应用后,1995年,纽约的凶杀案发生率降低了约25%,车 辆盗窃案发生率降低了约24%,而且这些数字还随着IT软硬件技术的持续更新和CompStat系统的不断完善而逐年下降。

对商业竞争的参与者们来说,大数据意味着激动人心的业务与服务创新机会。零售连锁企业、电商业都已在大数据挖掘与营销创新方面有着很多的成功案例,它们都是商业嗅觉极其敏锐、敢于投资未来的公司,也因此获得了丰厚的回报。

而对于那些拥有行业经验,并熟练掌握云计算开发和应用技能的小型企业,尤其是初创企业来说,则更是意义非凡。近几年,我们看到的一些明星初创公司,比如 Cloudera, Splunk, Klout, TellApart等,人员规模只在数十人,但对某个行业拥有深厚知识,并能通过云和大数据的技术手段,快速解决该行业的共性需求和痛点——在未来数年, 这样的“小而精”、“快而准”企业会越来越多,并做出有可能改变世界的颠覆性产品。很高兴看到,在北京中关村,在微软的云加速器二期,也有类似的初创企业 加入,和硅谷、海法的创业者们一起,把握住了时代的脉搏。

总而言之,云计算和大数据的结合,将对今后的政治、经济、科技、民生产生难于估量的影响。无论是做硬件、做平台,还是做应用、做服务,归根结底都是以数据 为核心、以数据为动力,来提升产品对用户的引力、强化企业竞争力、创造新的商业机遇。数据已经被认为是宝贵资源,任何一家有雄心、渴望获取洞察力的企业, 都应及早制定大数据战略和方案。否则,所有的机会将被“数据鸿沟”所延宕。

      张亚勤博士    1966年出生于山西太原,12岁考入中国科学技术大学少年班,23岁获得美国乔治·华盛顿大学电气工程博士学位。他是数字影像和视频技术、多媒体通讯方面 。张亚勤博士现任微软公司全球副总裁、微软亚太研发集团主席,负责微软在中国和亚太地区的科研及产品开发的整体布局。他同时作为微软大中华区战略决策委员会的成员,与其他成员一起,领导微软在大中华区统一战略的制定,推进微软在这一地区的业务发展、市场策略及本土自主创新


版权所有©江西省赣萍商会   技术支持:江西华邦LOGO黑.png

邮编 :330000   电话:0791-88680706     传真:0791-88119670    地址:江西省南昌市东湖区北京西路104号(老省政府对面)如家酒店11楼 备案号:赣ICP备13005044号-1