首页 自媒自媒体云科技时代正文

阿里科技下午茶:手淘背后的人工智能以及未来思考

  时间:2016年12月13日下午

  地点:北京中关村创业大街言几又书店二层

  主题:“阿里科技下午茶”

  主讲人:庄卓然,花名南天,阿里资深技术总监,曾负责淘宝移动平台、天猫双11,现负责淘宝本地生活、阿里百川、优酷产品技术平台

  以下为本次阿里科技下午茶的下半部分。

  [手淘背后的人工智能]

  刚才讲的三个中间件技术(ATLAS、ACCS和WEEX),是在整个手淘的发展过程中非常重要的三个基础中间件。这三个中间件解决了构建的问题、通讯的问题和开发方式的问题,更重要的让我们真正意义上进入到了人工智能的方式。

  为什么?刚才讲2012年的时候大量开始用机器学习去做推荐,希望它能改变整体的平台结构,但是其实很难,尤其是双11。比如双11需要整个生态圈跟平台一起努力,当跟商家说在什么样的时间点、什么样的位置做曝光,商家很开心的去备货。但是跟他讲,今天要做个性化了,不知道会什么时候、出现在什么位置、被什么人看到,都不知道了,商家就疯掉了,双11备这么多货卖不出去可能就会挂掉,这是现实的问题。

  这件事情很难在双11这样的一个场景下被推广开。在移动这个场景下,真正出现了这样的一个机会,因为屏幕更小。在这么小的情况下,人工能够运营的东西太有限了,能够穿插的信息也太有限了,而机器学习和人工智能是唯一的有前景的路线。

  有两个非常好的应用场景。第一个是搜索和推荐,这是一个完全的个性化的首页,当然还可以做得更好。实际上这里面也有很多有意思的点跟大家分享,比如说当时的手淘做了一个产品叫“有好货”,这个产品每天有超过两千万的人使用。这个机制跟下面的推荐还不一样,有一波达人和买手在这个平台挑选出来,把认为好的东西放到一个相当于精品的商品库,根据用户的知识图谱和兴趣图谱做推荐。

  我当时看用户的反馈、APP的评价,会经常说有好货做得不错,但为什么不更新?其实我们每天都更新,因为算法每天都在算,后来我搞明白了,用户指的不更新是首页的入口图没换。然后我们每天入口图做一些更新,果然转化率就涨上来了。后来发现我们是不是再做一步,把入口图再进一步个性化,直接给用户看的入口图就是“有好货”里跟用户相关的商品。这个事情做完了以后发现点击率又提升了很多,用这样的方式把首页的所有元素都做了这样的处理。用户看到的图片跟别人是不一样的,虽然都是有好货、爱逛街,但是你的图是个性化的。

  在每一个页面里的组合也是不一样的,大量的运用了千人千面的个性化的技术。在淘宝做这个事情是有天然的优势,整个算法经历了非常快速的变化,经历了很快的迭代过程。

  2016年AlphaGo赢了李世石,把关于人工智能的应用推到了一个井喷的状态。为什么说阿里是一个非常好的做人工智能的地方?第一,所有的阿里数据都是结构化的,这是一个得天独厚的特点。举个例子,假如要判断一个剧好不好,有没有人去看、去买,通常的做法是用自然语言处理的方式,微博上去看一下,比如有一条这么写“人人都说《盗墓笔记》很好,剧情很好,演绎的很精彩,我看过后只能呵呵”,如果用自然语言抽取这样的数据,会抽取什么样的特征?“很好”,说明剧情很好,到了“呵呵”,这是什么鬼?机器很难判断。

  但是电商不是这样,类、目、属性等都是非常结构化的。包括季节词的抽取、颜色词的抽取等,都有整套的机制保证数据的纯净性。所以基本的内容是非常结构化的,方便了建立知识图谱的便利性,这是第一个优势。

  第二个优势,我们通过一个核心反馈系统做算法的训练,可以做这样的一个事情。举个例子,AlphaGo跟李世石下棋之前,就机器自己在这里面通过端到端的反馈系统学习,到最后能够打穿关。通常是这样的方式,今天实际上大量的调参工作可以让机器自己实现端到端的学习和优化,这是今年(2016)整个人工智能变化的很核心一个关节。

  淘宝为什么合适做这件事呢?是因为搜索和推荐的反馈,很容易在用户的行为中得到反馈。通过这样的一个场景,又是大规模的数据和有限元解的反馈,使得这样的训练过程会变得非常简单。

  这样去训练的模型,无论是知识图谱、兴趣图谱,应用的场景很多,还可以应用到新品发售、销量预测等等一系列的环节。所以这个里面就是有一个很好的人工智能和机器学习的应用场景。

  第二个,另外举一个例子,这就是“问大家”了。我们在做社区化的尝试,希望通过解决用户的核心痛点问题,产生人和人的连接。今天所有人买东西的时候,都想看评价页面。那能不能再直接一点,通过算法可以提一个问题给买过的人,谁收到谁不收到,都通过算法去解决。

  这样其实有几个好处。第一个原来的评价,很多都是默认好评,想得到更多的信息,但其实评价的人不会写上去。“问大家”这样的机制是算法去挑选分发的,会交给一个真实买过的人去回答问题。同样用机器学习、自然语言处理的方式,降低了提问的量,因为它可以找到原有的问题并归类过去,同时把这个问题提给一个既乐意回答这个问题、又没有被过度骚扰的买家,使得整个问和答的环节更加迅速。

  这也是在淘宝,尤其到移动化时代以后,因为这两个特质——平面变小了、用户随时在线,使得机器学习和人工智能有大量应用的场景。

  [移动端的创新互动]

  这其实是想给大家看的第三个环节,原来看PC和互联网的时候,因为程序运营的载体是浏览器,而浏览器只给一个最基本的渲染能力。但移动客户端是一个富客户端,远远跳出PC互联网渲染能力,会基于GL、Web View等做出很好的内容,这对今天的年轻人是比较有吸引力的。

  Poplayer,去年团队的创新大奖是发给了这个团队。他们做了这么一个Web View,能出现在任何一个页面上,还可以实现各种各样的效果,有很多的应用场景都是通过这样的方式去做的。去年(2015年)的密令红包背后也是靠这个技术去支撑,可以定义任意形状的Web View。

  第二个大量尝试了Web 3D,典型的应用就是2016年的双11“捉猫猫”,必须找到不同的猫、必须抓它,通过摄像头可以实现更有意思的线上和线下的结合,也是大量的运用了Web 3D和LBS AR的技术。

  接下来这个是一个预告,通过Web GL的图形库,我们会通过GS的方式快速做成不一样的体验和展示。所有的这些都可以通过GS调整,这个使得客户端开始变得生动起来了。

  从2013年到2014年,整个无线团队做得核心的事情还是搬家。PC上什么样,至少能够在移动端实现,要把生态搬到移动上。但是2014年到2015年再到2016年,我们重新定义移动化的电商究竟是什么。这时候就不一样了,不再是PC往移动端搬迁的过程,而是重新定义移动电商究竟是什么。这是两个阶段,第一个是淘宝的无线化,第二个是无线化的淘宝。

  无线化的淘宝,内容化、社区化、本地生活服务化。为什么做几个方面呢。有三个不同点,第一个随时在线,不像互联网时代坐到PC面前才可以上网。

  第二个不同,LBS定位。因为手机随身携带,随时在定位用户的位置,所以这也是跟PC互联网很大的不同。

  第三个点,在于更丰富的输入输出。所以这个时候去看,今天在移动互联网时代出来的新公司,每一家新公司基本上抓住了三个不同点中的某一个点,让它们有机会重塑一个行业。

  我们定义移动化的电商是什么的时候,同样要从这三个维度来去思考问题。作为本质上的出发点,再结合现在的业务形态,去定义未来淘宝应该怎么走。这是年初时我跟逍遥子说的三个关键词。

  内容化,我讲讲我的理解。过去的电商其实是一个追求效率的平台,在这上面所有的产品的塑造都是在追求购物的效率,搜索、推荐、营销,到详情页的页面,都是追求效率、满足信任感、快速成交、下单。店铺为什么这么设计,因为货架的成交效率更高。

  过去整个淘宝的形态都是在以追求效率、成交效率为优先,但是当达到一个超过4亿的月活跃用户规模的时候,电商用户除了快速买到东西外,其实希望让用户更多的了解有什么东西可以买、有什么好商品可以发现,我觉得这是淘宝要解决的一个很核心的问题。因为它是全球最大的商品库之一,应该从节省时间的平台变成一个killing time的消费类平台。我们用不同的玩法,偏内容的方式拉动成交、拉动销售。

  双12有很多网红直播,网红的直播在这个平台上构建了非常有意思的公域和私域的方式,真正变成了粉丝经济的消费方式。双11刚开始的时候,整个淘宝的服饰成交增速是非常快的。淘宝内容化之后,粉丝关系、网红的经营方式,使得很多网红今天已经变成一个品牌了,有很强的号召力。今天淘宝建立了很多通过粉丝运营的私域运营方式,个人商家自己的运营空间来运作自己粉丝的方式,使得成交变得非常有意思。

  所以在内容化和社区化的过程中,我们思考的是怎么样实现淘宝做到小而美,小而美的方式应该通过产品的方式建立这样的一个运营自己粉丝的阵地,有不同的工具来建立自己和自己粉丝的连接,拉动最终的销售。所以内容化是媒体升级的第一步。

  社区化是什么呢,淘宝过去来说是一个垂直领域的连接平台,它连接人和商品、人和店铺、人和品牌,但实际上在一些特殊的场景里,因为随时在线之后,可以增加人和人之间的弱连接,增加场景上人和人连接的属性,使得连接的属性增强。

  其实我认为做分发类的APP,都会经历这样三种分发的形态,内容化、社区化和智能化。今天的淘宝不断改造内容属性的组织方式,每一代的用户触点技术发生变化的时候,从PC到互联网、从图文再到视频,每次变革的本质都在于信息组织和分发的方式,发生了变化。

  第三,本地生活服务化。为什么做这件事情,我们看到今天电商的模型是一个中心化模式,它是一个非常经济的销售问题,可以全国销售。卖的人越多、成本越低、服务就越好,就可以卖更多,永远是这样的线性模型。在这样的模型下,其实不能改变太多,比如说时效性、物流成本。除了计划型的购买,每一个用户都还有很多及时性消费的需求,及时性的消费在这个平台里没有被满足。我们再做淘宝便利店、淘宝到家、淘宝外卖跟饿了么合作,其实都是为了满足周围三公里的及时性消费市场。

  再看VR。我们从2016年初开始做“buy+”,buy+只是触达的方式,以及与用户沟通的方式。而我们想将全球最大的商品库从图文升级到3D,我们看媒体变化的过程从最早的文本到图片到视频,到今年火爆的直播,是很明显的演变。从一维到二维一定会进入到三维的时代,这是必然的发展的路径。

  至于是不是VR还不好说,需要一个很长的时间周期验证,但是这里面一定会是说整个的表达方式从2D进入到3D。我们从年初开始做了很多的工作在降低建模的成本,能够让商家以简单的方式、最低的成本,得到效果非常好的3D模型。

  第一种通过手机拍一圈,建一个3D模型的效果。第二个,就像这个展示的一样,实际上通过3D扫描仪,去扫描整个的商品内容。第三个是光场扫描。这三个方案从成本和精细度逐渐往上提升。手机的方案是零成本,3D扫描差不多在两百块钱左右,然后光场的就更贵了。

上图右侧是2016年五月份的时候做的VR全景直播的效果。

  团队工作的核心还是希望聚焦在商品的3D建模,不断的降低建模成本。即使今天在手机上,其实大家去看这样的3D建模技术也会有很好的应用场景,展示也是一个很好的方式,无论是互动也好,还是更好的把它跟虚拟现实的结合,都有很多的应用空间。同样的一个包,可以投射到真实的空间里,可以看看这个包放在你身边是什么样的场景。

  今年还有就是直播。直播我觉得是非常有意思的点,直播本身不是个业务,但是电商直播我觉得它是一个业务、秀场直播是一个业务,直播代表的是一种工具,甚至我觉得直播更重要的是一种思想。

  怎么样在业务的过程中,跟用户有一个更简单、更实时的互动性?我们用这样的实时互动性去增加业务的黏性,去产生更大的价值。2016年开始淘宝直播,我们做了很多尝试,其实不是像映客做打赏,更多的是分量信息流、商品流,更多的互动因素到直播里,实现在直播的过程中买商品、发红包、跟主播互动。

  淘宝变成了一个公域,而直播这样新的互动工具,进入到经营者和粉丝之间私域互动,这样一个经营的形态,我觉得是一个非常有意义的尝试。

  这是本地生活里做的事情,就是外卖、到家、便利店,这一部分更多的是在业务和产品层面;它还能够赋能线下的商业经营者、便利超市等。通过今天的技术做物流规划,做线上的销售数据化运营,能够去服务周围三公里的消费者。在北京我们还没有完全开放便利店的服务,在杭州、上海,双11还有双12都创了新高,覆盖了整个的杭州城区和上海城区,每一个店会提供周围三公里的便利店外卖,这样一个及时送达服务。

  前面介绍的都是在淘宝这几年做的一些尝试,核心来说其实是两部分:最开始是通过基础的移动的中间件实现了淘宝的无线化,“搬家”;第二个阶段针对无线的本质、特征,重新定义移动电商,尝试了几个比较有意义的方向,有两个已经成型和大规模的应用,包括机器学习和人工智能的应用和互动娱乐性的提升。有一些是现在正在做的,从业务和产品形态上的尝试,偏内容化、社区化和本地生活服务化等等。

  [对未来的思考]

  关于未来我们也有一些思考,今天实际上是一个非常有意思的时代,无论是从阿里巴巴1999年成立到现在,我觉得只经历过一次大的技术上的变革,就是从PC到移动。

  这几年我们发现有很多这样的技术都具备这样的潜力,大概分为三种:一类叫新交互,从文本到图片,再到今天的视频,互联网的流量到2017年可能会有2/3到视频里。年轻人消费更多的是基于视频形态,2016年初的时候我也不能理解为什么直播这么火,为什么年轻人喜欢看直播,但它确确实实在发生,而且整个的媒体互动性要求可能会越来越多。

  所以演进的途径,在2017年可能真会进入到一个视频互动的形态。再到五年之后可能真的进入VR和AR,一个更加3D的时代。我觉得在整个交互形态上,确实对整个技术和产品的构造会带来很大的影响,每一次技术上的变化其实带来的是本质上的变化。

  我经常举的一个例子,当年看了一个视频,里面讲的是诺基亚、柯达很大的商业帝国一下子崩塌,都是这样的一个场景,每次的技术变化往往是从交互开始的。举一个例子,微软最早提出“云端”这个词,2004年就开始做,微软当时做了一个事情叫移动端的windows,它的设计还保留了原来PC时代的鼠标和双击,还有一个小的键,用大拇指可以操作,像鼠标这样移动,也可以双击。后来的结局大家知道,当苹果出来了以后,通过更平滑的人机交互方式,也就是触屏方式,基本上不会给上一种交互方式留下任何生存的空间。

  当年在手淘移动化的时候也经常会讲的一件事情,究竟是做淘宝的移动化,还是做移动化的淘宝,这里面有很大的不同。每一次交互入口上的变化,都会带来未来很多产品设计、信息分发变化,交互在未来的一段时间里一定会带来这样的变化,无论是2017年的短视频,还是再未来的AR、VR等等,2D到3D一定是一个必经之路。

  这里面无论是计算机视觉和计算机图形,可能在接下来地一段时间里都会是一个很大的应用场景和爆发点。

  

  第二,在计算领域,假如今天进入到VR的时代,云计算对网络传输有更高的要求,对存储有高的要求,整个计算上也同样会产生更大的要求。未来随着人工智能的兴起,可能整个的走势会更加明确的一分为二,平台往下沉,提供从CPU到GPU甚至定制计算的硬件解决方案。

  再到上面数据处理平台,这之上各个垂直领域的数据算法解决方案,人脸识别、语言识别等等一系列解决方案等。上面的应用可能真的就跟平台之间的关系,因为能够端到端的训练,所以找一个场景,依托平台的方案,形成一个新的业务形态。CNN出来差不多十年到二十年的历史了,DNN是2013年还是2014年第一次看到这样的论文,再到RNN,算法的迭代也非常快。

  我相信在未来的一段时间里,可能大的前景路径是三个创新:新的交互形态、新的内容和媒体的升级、新的计算方式,平台如何下沉,不断的从垂直领域再到数据计算平台,再到下面的芯片升级。

  今天其实有很多深度学习的芯片,都是把深度学习里面非常复杂的动作放在芯片上完成。即使做这一件事情,就使得深度学习的计算方式有一个很大提升,接下来可能还包括存储、网络升级等过程。所以这是我认为可能在接下来的十年里很有可能发生的事情,VR、AR这个事情会持续发展一段时间,但是至少今天人工智能的大规模应用很快就能看到。

  技术的进步永远会超出我们的想象。2013的时候,我带阿里无线事业部,年初的时候我们定了一个目标,到年底要实现移动化35%的成交额、手淘上要完成35%,结果这个目标刚定完就实现了。每次技术上的变化都会超出我们的想象。

  Q&A:

  Q:怎么看“语音购物”?

  南天:语音是一种输入方式,很早在淘宝上就有语音搜索。其实语音这件事情要看消费场景,假如说现在要买一件衣服的话,绝对不会用语音来消费,但是其它的场景会有可能,比如说开车的过程。

  Q:与微信小程序的区别?怎么看Amazon Go的线下体验?

  南天:我们跟微信还是有很多本质上的不同,阿里所有的应用是互联网的终点应用,而微信包括百度扮演的是互联网的起点应用。当你想到用手机上网的时候,可能第一时间想的是搜索和通讯的需求。阿里的淘宝是一个垂直领域的起点,想到电商的时候会想到打开淘宝。所以起点的应用和终点的应用是有很多不同的。

  起点应用的用户规模是很大的,但是终点应用的价值更大。阿里的应用跟终点更近,比如说担保的交易、运营的规则,在阿里上买东西会更放心,因为电商的本质就是在解决信任问题。解决信任问题无非这两种方式:要不然是B2C做规则,把规则做到极致就是一个B2C的方式;要不然就是社群,通过社区化的方式。

  小程序今天不可能在这些点上去解决你的问题,它其实是连接和分发的平台,还是顺应着这个起点在合作,所以我觉得本质上非常不同。从2013年的时候,那时候微信已经很大了,而且确实也在做一些跟电商看起来很相关的东西。比如说微店,还有公众号有一些很相关的东西,到2013年左右的时候已经非常清楚,哪些是微信不能做的,哪些东西是我们不能做的。因为从整个业务的定位,就决定了很多往外的延展没有像想象中的那么容易。比如阿里打假跑掉的店都去做了微商,还有就是食品等等这类型的需求。

  其实产品都是有边界的,这个边界是不是能够把握得住,这是很重要的一点。所以在这个点上我觉得其实我们相当于都是在结合自己的优势,不断的能够提供更便捷的服务给用户,但实际上方式和方法不太一样。

  第二个问题,Amazon go的话题,其实大家对未来的思考,我觉得路径上是有一点不同的。今天并不是说要单纯的去改造一个线下的销售体验,像支付也不需要去排队了。今天阿里思考的事情,是怎么样把线下的销售和线上的销售能够更好的整合。

  今天讲到家、便利店,它是一个初级的形态,既可以在线上买也可以在线下买,怎么样把线上和线下的库存打通、把线上和线下的会员打通、把线上和下的服务打通,还是要通过技术赋能合作伙伴。原来是综合成本经营最低吸引了商家,现在用户也越来越多,这是一个良性地循环。

  今天提供的工具不再仅仅覆盖线上的渠道,不仅仅在销售环节、会员管理环节、品销一体化环节,怎么样来做这个事情。马总讲新零售和新制造是一个更大的话题,需要花很长的时间来去做,但是也代表着今天我们去看待这一件事情,并不是在一个点上去改变。

  Q:怎么看电视?

  南天:有一个观念我是认同的,未来互联网的入口可能会别不同的硬件入口所分化掉,但是会不会是电视,这个现在还没有结论。现在其实电视的打开率非常低,而且人群基本上是两类,一类是孩子,一类是老人。绝大多数互联网的核心使用群体,即使在家里的情况下,也更习惯用pad、手机来去访问互联网。

  未来一定会出现IOT对整个互联网入口的分化,智能硬件我觉得是一个很好的场景,电视还不好说。今天我们在尝试IOT布局,这个产业还早。

  Q:安卓低端机的用户体验?

  南天:首先说整个的程序设计并不是以市场上的最高配置去做设计,这是第一个出发点。我们在看性能极限的评测,是拿整个市场的平均水平甚至稍微低一点。比如说更多的去选红米或者是小米4这样的机型,来去作为安卓的极限设计。

  我们确实会面对很多的挑战。大家也都知道,所有的安卓手机厂商都在做很多的定制,兼容性有非常多的问题。刚才讲到VR,我们今天做buy+也同样面对这样的问题。CPU够了可以跑4K的视频,但是屏幕又不够。等屏幕是可以跑,时延变小了,但是CPU又不够,又不能跑高清的视频,这确实是今天面对的很多移动客户端的挑战。

  我们的处理方式还是要分级。高性能的设备,会是什么样子的。中间的设备,去看它的核数、内存。有一些功能确实在某些手机上跑不了,那就算了。但是确实每一个开发,也不是说要把整个软件都耗尽。

  从另外一个方面讲,每一年都会有硬件的能力被软件耗尽,从而进入到下一级硬件的升级。我觉得到现在为止还是会不断面临的话题,会持久通过升级去解决软件耗尽的问题。我们的设计不会以一个最高的硬件标准去做整个设计的标准,也不会去把所有的机器看成一样的情况,而是会做分级的处理,但是客观的规律确实会持续进入到不断换机迭代的过程。双11之后我们也跟腾讯、百度、华为等做一个绿色联盟,看是不是能够把安卓的指标量化,帮助我们开发性能和体验更好的APP,这个需要整个产业链一起做。

  注:本稿件摘自入驻数据观自媒体—云科技时代,作者吴宁川,版权著作权归原创者所有,转载请注明来源。

责任编辑:汤德正

分享:
延伸阅读
    大数据概念_大数据分析_大数据应用_大数据百科专题
    贵州

    贵州大数据产业政策

    贵州大数据产业动态

    贵州大数据企业

    更多
    “智慧中国杯”全国大数据创新应用大赛
    企业
    更多