首页 观点正文

陈金俊:寻找不同行业数据的微弱关系,可获取新的商机

  数据观现场报道2016年11月17日下午,第三届世界互联网大会“大数据论坛”举行,本次论坛由中国国家互联网信息办公室和浙江省人民政府指导支持,中国科学院主办,中科学院信息工程研究所承办,数据中心联盟协办。

  在该论坛上,电器和电子工程师协会可拓展计算委员会主席陈金俊先生发表了“大数据—大应用”的主题演讲。他认为,在大数据时代把不同种类的数据放在一起成为可能,而不同种类数据的微弱关系也意味着新的市场机遇,关键点是怎么找关联性,还有隐私和安全。

  以下是演讲全文:

  各位领导,各位嘉宾,大家下午好!现在很多人都在谈大数据,各个国家、各个企业、各个地方。有的人会说数据和石油一样,是重要的资源,也有的人会说数据加人才是现代企业很重要的决定性的力量,有很多包括Big data等不同的,关键的核心点都是类似的,就是从大数据当中找到有用的信息,对于企业来讲新的产品、新的机会,对政府来讲新的管理模式等。

  对大数据的看法有很多种,不同的人有不同的看法,还有人从投资的角度,不管你怎么看大数据,最基本的概念是要有价值要有Value,没有价值,不管数据多么大,其实没有太多的意义。从Value的角度讲,关心的是能不能从大数据分析出更多有用的信心,比如说新的产品,相比较传统的企业单个分析数据,跨行业,不同种类的数据分析,可能会令人更加的激动。过去几年云计算的普及以及深度合作,拥有很多不同种类的数据成为可能。不像以前我们只能设想我们有很多种数据,现在因为云计算很普及,大家把数据放在云上,拥有不同种类的数据成为现实。

  当然单个领域数据的分析缺失是很重要的,比如说一个超市的零售业,你对用户购买兴趣消费的分析很有用,不同种类的数据分析,不同种类的数据因为云计算的普及,因为大数据成为可能。我们的观点,对企业家来讲分析不同种类的数据。

  一个真实的例子,在澳大利亚跟我合作的企业,有订飞机票的企业,还有超市的企业,原来他们是两个不同的企业,他们各自管理各自的数据,现在因为云计算的原因,他们把数据放在云上,比如说有人经常晚上买东西,这样的人你就应该推荐晚上的飞机票。把不同种类的数据之间微弱的关系找出来,这种微弱的关系往往意味着新的市场、新的产品,这个在以前大数据之前,在云计算之前不是很容易想象的。因为那个时候你并没有把不同种类的数据放在一起。

  对于做研究的来讲,我们知道要做大数据,首先得有大数据,因为要但量多,数据更新特别的快我们知道对大多数研究者来说我们没有真实的数据,企业不太愿意跟我们分享他们真实的数据,可能基于各种各样的原因。所以我们只能用一些官方的数据,对于研究者来讲,如果要更有效,我们要接触真实的数据。如何接触真实的数据?要更多的要跟企业合作,解决他们的问题,可以访问他们的数据。否则的话,我们访问的网上公开的数据往往并不是实的。

  在这个阶段上,无论从企业来说,分析不同种类的数据,对科研人员来讲的话,要接受真实的数据进行分析,在目前的阶段大数据更多的是应用。你现在去定义大数据科学,其实并不是一件很清楚的事情,什么是大数据科学?更多的是应用。从应用当中产生一些数据的科学,然后解决问题。基于这个出发点,我们跟很强的跟企业合作,现在最典型的两类行业,零售业和航空订票的行业,就是因为把不同种类的数据放在一起,找到他们微弱的关联性。

  这种微弱的关联性刚才说了,比如很多人晚上出去买东西,你就给他推荐晚上的飞机票,还有把医院的数据和保险公司的数据放在一起分析,分析过去两年医院的健康的情况,然后可以帮助保险公司设计出更好的保险产品,这是两个真实的例子。总的来讲,就是把不同种类数据放在一起找出不同的关联性,产生新的商机,是企业关心的,这是大数据带来新的机会,在云计算普及之前只能设想不同的数据放在一起,现在因为云计算数据放在一起产生大数据,拥有不同种类的数据成为现实。

  跟企业合作的时候,企业常常问我们的问题非常简单,尤其是一些传统企业,他们并不关心你跟我讲的大数据,就告诉我能得到什么。另外一个问题是你说把我这些数据不同种类的放在一起,医院的数据,保险公司的数据。比如说订票的会员数据,还有超市的数据放在一起进行分析,你怎么保证他们的隐私?这是他们直接问我的。

  做企业大家知道,并不关心三年、五年,我要的就是现在。所以他一定要很快速的,相应的就在这三方面做分析,不同种类的数据之间把关联性找到非常微弱的关联性往往意味着新的商机,如果关联性非常强并没有太大的意义,你能看到的机会别人也可以看到。大数据不同种类的数据分析出来找到微弱的关联性,就像刚才医院和保险公司一样即刻帮助保险公司提供更好的产品。就像刚才说的超市和订票公司一样,可以告诉订票公司更好的推进产品,不同种类的数据觉得因为云计算过去的普及产生的,因为大数据产生的新的比较集中的点,这并不意味着单纯的一个点不重要,是重要的。

  另外关于隐私安全,做隐私知道的,隐私的问题是非常主观的问题,什么隐私?什么不隐私?如何基于应用设计出考虑到设计、空间,主要是隐私,昨天我生病了,昨天是隐私,今天我好了就不是隐私。最后的结论点就是说大数据不管怎么看它,最终还是回归到价值,一定要有价值,从价值的角度看它。如果没有价值,这个数据再大也没有意义。

  从应用的驱动产生价值,在这个阶段应用驱动会更恰当一些,考虑什么是数据科学。更加令人激动的是不同种类的数据找到它的关联性意味着新的商机对企业来讲及因为云计算的普及,大数据不同种类的数据成为现实,是一个新的点,是一个比较激动的点。这是我们一个观点,也是我们正在做的,谢谢大家。

  

责任编辑:陈近梅

分享:
延伸阅读
    大数据概念_大数据分析_大数据应用_大数据百科专题
    贵州

    贵州大数据产业政策

    贵州大数据产业动态

    贵州大数据企业

    更多
    “智慧中国杯”全国大数据创新应用大赛
    企业
    更多