首页 观点正文

黄罡:软件定义的数据智能

   2017年7月16日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,北大软件工程研究所、全国高校大数据教育联盟、北达软协办,CIO时代APP承办的“第六届中国大数据应用论坛”在北京大学中关新园隆重举行。北京大学软件工程研究所副所长、中国新一代IT产业推进联盟技术分委会主任黄罡在活动上作了题为《软件定义的数据智能》的主题分享。以下为演讲实录:

  大家好!非常高兴和大家做分享。我的报告分为两部分:一方面是从企业来看,在做信息化到做智能化的转型过程中我们怎么去看大数据、人工智能,尤其是技术选型方面。不要掉到坑里,不要从夏天直接进入到冬天。另外,经过我们的研究,我们认为,这中间的核心是数据智能,它的挑战是什么?怎么用一些手段解决它?软件定义的方法如何实现?

  一、新一代信息技术,开启信息化3.0时代

  如今,新一代信息技术很火,与传统的相比,为什么它变成了新一代?老的那一套为什么没有了?信息技术本身支撑信息化,从信息化的角度来看,我们已经进入了信息化3.0时代。1995年是互联网商用化的起源,那一年产生的epay、亚马逊,互联网商业化开启了网络化应用的时代。在此之前主要是单机应用,面对着每个企业、个人数字化的问题。到了网络化阶段,更多的是以联网应用为特征,后台有个服务器,通过客户端、App将服务或数据传递到用户手中。2015年主要是大数据、人工智能、云计算。这时我们再回过头看,发现如今真正要做的是连接起来。信息化3.0时代大部分朋友都已经是在网络化阶段了,我们要面临一个抉择,是否做智慧化,也就是转型。可能对于我们这些以IT为核心或至少为核心竞争力的企业而言,该不该用大数据、人工智能,是不是用错了,直接从夏天走到冬天,还是走向秋天。我们一定要想明白,以前是成本中心,如今变成业务创新的中心。这个创新源自于大数据和人工智能,但我们还是要强调它的抓手是什么,是直接抓虚机、自己搭一套私有云,还是做开源化软件、租别人的商用化、招募尽可能多的人工智能算法科学家,花巨资让他们研究出各种算法,这些都是我们需要考虑的问题。

  其实我们已经有前车之鉴了,即2000年的.COM泡沫。那时发现了互联网巨大的社会和经济价值,所有的企业都开始互联网化,大家可以看到把所有的钱和业绩增长点全部放到.COM里,只要建立一个网站,你的企业就会7×24小时被全世界的人看到。这是网络制造商制造出来的一个话题,你们什么都不用管,买路由器、服务器、联网费用就可以了。但经过短短的三年,2000年纳斯达克遭遇了巨大的损失,6天市值损失60%。

  

  美国带来的金融危机直到今天还未消散。上图为美国总统的经济顾问委员会做的,强调美国GDP不停的会有波峰波谷,这个图更重要的是指最近一次是金融危机,但金融危机此前居然是互联网泡沫——.COM泡沫,可以看到它对美国经济打击有多大。

  二、新一代信息技术,强调应用型技术

  如今,人工智能、大数据、云计算几乎与当时互联网商用化产生价值后所有人都想狂热投互联网的情况一样。为什么会这样?有一个论证,一项技术要为企业带来核心竞争力,一定是项私有化或专有化的应用型技术,而不是像路由器、服务器这种商品化的基础性技术,因为如果你的竞争对手发现,搭个网站居然就可以将销量一下子与竞争对手拉开,你的竞争对手也一定会花钱买这个,商品化全部相同。这个论调就是IT不能为你的企业带来核心竞争力,但它能改善。我们今天的问题在于,云计算、大数据、人工智能,到底什么是能给我们带来的,什么是不能给我们带来的,我们也需要进行分析。

  接下来是关于云计算。2011年的《大转变》一书中提到,IT变成商品型基础化技术是一件好事,因为这变成了一种新的资源,会引发新的信息革命,就像爱迪生发明电灯会带来能源革命。云计算就是电厂,互联网就是电线,我们的核心能力全部体现在电器上,不是云计算、也不是互联网。从这个观点来看,个人认为是非常准确的。

  三、新一代信息技术,分基础型和应用型

  1.基础型技术

  凡是开源的或公有云能买到的全都是基础型技术,因为它们全都是商品化的,包括互联网和移动互联网也都是。

  2.应用型技术

  应用型技术则包括大数据、人工智能、信物融合计算、人机物融合计算。当某个应用型技术变得越来越普世时,它会变成基础型技术。我们要琢磨的是,显然大数据、人工智能可以为我们带来核心竞争力,我们企业应该投入到开源还是投入到什么?回顾一下,1997年SGI公司当时的CTO就发布了BIG DATA,因此大数据根本不是什么新东西,20年前就有人提了。以及人工智能,人工智能最开始是软件自动化,即软件本身编软件。第一阶段、第二阶段都是人定义规则,但今天以深度学习为代表的实际上都是模糊的,深度神经网络产生的都不是由人的常识、知识、专家经验定义的。因此,确实像马云说的,不是人工智能,而是机器智能。但我认为不论是机器智能还是什么,我们今天看人工智能的好处,一是有数据,二是有算法,当然还有云计算,最关键的是在合适的场景里面落地了,我认为这数据和算法的场景化是人工智能的第三次崛起。

  3.大数据与人工智能场景化的挑战

  数据、算法的场景化是我们企业做大数据、人工智能核心竞争力的抓手。这个抓手有没有挑战?答案是肯定的。

  第一是信息孤岛。信息孤岛有两个含义,一个是企业内部的信息孤岛,一个是外部的信息孤岛,其中最重要的是政府的信息孤岛。数据孤岛就是数据拿不出来。第二是功能黑盒。以智能音响为例,真正的智能产生预测性分析或决策性分析,控制互联网使智能家居进行相应的动作。但很遗憾,小米和格力的永远不会互通,也就是“功能黑盒”。

  四、北大的实践

  我们当时畅想,是不是互联网上所有的资源拼成一台超级计算机,一定不一样。我带领的团队希望说,从软件的角度如何将信息孤岛打破。打破信息孤岛经典的两种思路:一种是推倒重来,一种是旧系统改造。北大借鉴了生物上的反射现象,从外部的表征可以猜出生物体内部的特征。我们有一套算法,从用户使用前端界面就能智能的学习后台藏的数据、数据结构,以及如何读写这样的数据。大概的原理大家可以看到,我们会在黑盒中获得使用权限,执行业务流程,恢复体系结构与数据语义,生成业务接口。

  一个形象的比喻就像“盾构机”,从下自动将接口打穿。我们的技术面向市场推出一年来,已在30多个省市打破2000多个孤岛,基本以政府孤岛为主。以贵阳实践为例,今年2月份,我们用了一个月的时间,五名软件工程师在无原系统开发商配合、无数据库开放、缺乏数据字典的前提下,成功完成了贵阳53家单位的信息孤岛的打破。完成了“索引管道式”数据交换共享。实现了物理分散、逻辑统一、管控可信、标准一致的政务信息资源共享交换体系。当然我们也打破了很多企业的内部信息孤岛。南方电网用的GIS系统,对方不提供开放接口,我们很快帮助他们将数据实时提取出来。另外,打破企业外部信息孤岛,把京东、天猫、淘宝电商平台的数据接口化后,便能实现对接了。我们也开放了API,应该是国内API最多的一个市场了。

  我们将数据孤岛打破、功能黑盒打开了,那智能在哪?大家如果用苹果手机就会发现,苹果手机可以搜索到你第三方数据的应用,核心是把你手机上App里的数据和功能拿出来。但他们打不开的App,我们都能打开。甚至把你已经建立好的场景化给重新解构。

  当我们把所有的这些都打开后,数据最终会成为什么?尤其是企业。今天的Twitter、Google、Facebook,实际上已经有30%,甚至50%的调用不是来自于他们各自的App,而来自于对外开放的API接口。什么概念呢?企业应该关注自身的业务和业务创新,把业务以API的方式、接口、数据接口、智能接口的方式对外开放后,就能最大的获得合作伙伴和用户。从以前的内容连接改变为数据与功能的连接。有人通过API提供数据、智能、算法,有人通过别人的API整合后进行自己的集成式创新,还有人在中间做媒介,这就是新的API经济。API经济今年是250亿美元的全球市场,未来会是上万亿的市场。因为越来越多的功能不是打开淘宝、京东买东西,而是在听音乐的时候,突然与音乐相关的周边产品直接从淘宝推送给你去买,你无需再打开淘宝。以API的方式全部串联起来,精准的推荐给你、保证你的安全隐私,这些都是与智能相关的东西。

  以上所有的成果既有研究性的,也有产业化。欢迎大家关注交流!谢谢!

责任编辑:陈近梅

分享: