首页 专栏魏凯正文

中国信息通信研究院魏凯:大数据市场调查报告

中国信息通信研究院技术与标准所移动互联网

与大数据部副主任高级工程师魏凯:大数据市场调查报

魏凯.jpg

  各位嘉宾下午好,我下午给大家发布中国信通院做的中国大数据产业发展调查报告的主要内容,这个报告从今天开始也在网上可以公开下载,我会后会附上二维码大家扫描下载。上午的环节里信通院和几家合作单位一块做了一个基于数据的大数据产业分析的平台,我们用大数据的方法分析大数据产业的发展,采集了很多案例,我们这个报告是用小数据的方法来监测大数据产业发展的状况。小数据的方法是抽样的方法。

  我首先讲一下这次做的这个报告的样本情况,我们采样了1465份有效的样本,我们通过问卷访谈的方式针对性地精准地访问用户和行业里客户的需求,包括现场访问635份、电话访谈467份、在线访谈363份。样本分布,这个报告主要关注的是企业级用户的应用和使用的情况,所以中小企业为主,年营业额1亿元以下的企业占总样本的66.1%。区域分布覆盖华北、东北很多地区,行业主要是互联网、电信、金融、制造、交通等行业。这是我们样本的分布,实际是小数据的方法。小数据的方法证明仍然是有效的,所以这个报告的方法论跟大家交代一下。

  主要内容有几方面。大数据市场的总体规模,大家非常关心总体规模的总量和细分领域的总量以及未来增长的情况,我们做了这样的方面。

  大数据市场规模到底有多大,我们对这些企业做了访谈以后估算出中国2016年大数据产业市场规模是168亿人民币,预计到2020年每年还将增长30%以上,这个增速是全球最快的。在这里我要跟大家交代一下,我们做的这个市场分析口径是狭义的大数据产业,指的是大数据相关的软件硬件和专业化的服务,这个口径不包括因为大数据的应用带来的附加值的变化,这个附加值的变化我们有专门的另外的测算,它对GDP的拉动作用非常大,间接作用非常大,这是这个产业的规模。大家可以看到我们预计到2020年中国的大数据市场狭义的市场规模是578亿人民币,增速是非常可观的。这是给在座很多企业的信心。

  从细分市场来看,就像刚才我说的口径包括软件服务和数据资源,从细分的市场来看,我们做了个对比,2015年发了一版大数据调研报告,今年跟2015年的数据做个对比的话,硬件占比下降了1.8%,软件市场规模是72.6亿,占比提高0.8%。大数据服务的市场规模是41.5亿,占比提高1%。

  应用情况怎么样?近六成的企业已经成立了相关的数据分析部门,有的是专职的有的是挂靠在某个二级部门里,比如刚才说的运营商在信息化部下挂了好几个,或者有的公司是直接成立的,很多传统企业也是这样做的,大概有六成已经成立了相关的专业部门。有超过1/3的企业已经开始使用大数据在业务中发挥很重要的作用。

  企业在做什么?两方面观察。大家越来越重视实时的数据分析,希望得到交互式分析的结果,这是企业使用数据分析的常见方式,而不是以前的报表DI静态的数据分析结果,这是一个很明显的需求。第二,怎么看这个,数据报表、图形、可视化数据展现的形式有个调查的结果。从应用场景来看,我们看到前四个主要的应用场景主要是营销的分析,我们的客户分析和内部运营以及供应链管理可以看到,数据的应用主要在外部,以外部的客户信息和供应链信息、经营信息分析和使用为主,这是应用场景的分类。

  大数据应用为企业带来最明显的效果是实现了智能决策和提升了运营效率,55.8%的企业实现了更智能的决策,48.2%的企业回答提升了运营效率,这是一个效果的变化。未来是很乐观的,今年年初的时候有一篇文章非常流行,大数据已经泡沫破灭了,要进入下半场了,我们可以看到在实体产业部门里在实体经济里对大数据的前景还是非常乐观的,一半以上的受访企业未来计划加大对大数据的投资,其中近20%的企业预计投资的增长会在50%以上,这是一个很乐观的消息。这是大数据应用的状况。

  第三部分的主要内容是数据资源的情况,如果没有数据资源任何的事情都是空谈。企业数据资源的增长我们可以对比2015年的数据来看,规模增速是非常快的,可以看到企业拥有的数据500T以上的区间增长了1.4个百分点,500T以上数据的拥有者企业是增长非常快的。企业的数据来源主要还是内部数据,以企业的内部生产、客户经营管理这些数据为主,大家理想中看到的像互联网的公开数据、免费的政府开放数据和外部的购买数据都是排在后面的,所以我们看到最有用的还是企业内部数据怎么挖掘潜力,怎么转换成价值。绝大部分数据资源实际是非结构化的,这是从量上来看,大部分数据是非结构化数据,但是实际上使用的时候恰恰相反,最常用的还是结构化数据,数据表、数据库的内容是使用最多的67.8%,各类文档、邮件、日志是其次的,再往后就是一些非结构化数据的使用,这也是符合直观的。未来随着机器学习、自然语言理解这些技术的发展,非结构化数据的使用将会提上企业的议事日程。

  第四,平台建设模式,企业有了数据有了应用需求怎么建平台,我们也做了一个调研。与2015年相比,我们看到选择自建大数据的平台的企业反而增多了,这是一个很有意思的现象。2015年的时候大概有18%的人说我把这个数据平台要外包给别人让别人去运营,现在收集到的问卷是53.9%的人觉得数据平台应该自己内部建设,也可能是私有云的形式也可能是托管云的形式。这是对平台建设方式的变化。还有一个变化就是对于开源的接受程度越来越高。2015年大部分还是倾向于使用必源软件,比如一些流行的数据库数据仓库,到了今年已经产生了很大的变化。53.9%的人认为应该选用开源的商业版,就是有服务的开源软件来做,有32.7%的受访用户他们认为应该选择社区版开源软件,这是没有维护的。还有少部分人选择闭源软件。

  企业选择数据软件产品时对安全性、稳定性和可扩展性最为关注,在线数据库服务及大数据优先选择。建设大数据平台的基础架构到底怎么选择,Hadoop越来越受欢迎,自建平台技术选型的时候,左边这个图没有打出来细的变化,39.2%选择Hadoop,22.4%的人选择Spark,18.4%的人选择MPP,12.7%的人选择小型机传统架构,这几个选项代表这样的含义。大数据平台企业规模是什么样子,我们看到分化了,二十台以下服务器的集群比例变高了,与此同时100台的500台的集群的规模也变多了,所以说大平台和小平台分化的情况进一步明显。

  政策需求和资源需求。企业希望政策环境怎么来帮助他们改善经营环境呢?有几方面。一是希望政府来完善相关的政策,比如法律法规、标准,这个玄想是67%。加强个人信息保护,开放更多公开信息资源,加大对科研的投入,这是企业的呼声。同时他们对外部资源的需求也很强烈,前面的几类包括工商信息、社保信息等等,希望从外部获取。这是产业对政策对资源的需求。上面是我们基于事实的技术统计的小数据的方法研究大数据产业的结论,可以供大家参考。这页纯属主观的认识,我们冒昧地预测下未来,展望下大数据的下半场到底什么样,我们从三方面来认识。

  第一,数据资源要像资产一样管起来。现在很多企业都认为数据是资产,未来有可能进入资产负债表,但是我们的硬资产是有标签的,有资产管理流程的,但是你想想企业里的数据有没有这样的体制,没有。很多数据资产管理还是很原始的,甚至根本没有相关的制度,要做好数据资产的管理实际是下水道工程,我们跟很多单位聊过,数据资产管理是一个看不见效益的事情,给领导申请预算说不出密码的汇报在哪里,所以下水道是很形象的比喻,怎么把数据像资产一样管起来,这是在下半场在大数据光鲜亮丽的表面要做的事情,不管是政府部门还是企业内部。还有企业间的流动,资产要跨机构流动,怎么样构建顺畅的下水道便于数据资源的使用,这是第一我们认为非常重要的下半场要做的事情。

  第二,技术平台。现在很多开源的模块、很多的发行版的厂商,有没有完善的企业的平台让这些用户去使用,他们需要一站式的数据平台,需要集成很多他们需要的功能,比如他需要完全兼容现在的SQL接口,让它的应用不用修改。还希望在这个平台上一份数据做实时的查询和机器学习,这些功能都需要对下一代的数据平台的软件体系做一些升级和改造,这是下半场企业需要的。

  最后,应用模式上,还在企业的外围偏营销偏获客,下半场我们认为会要转向核心业务,进入它的生产系统。现在有人谈核心银行和数据平台的融合,还有工业的IT和OT的融合,就是智能和生产要融合起来,数据的应用应该从企业的外围业务到核心业务逐步发展。还有从消费互联网向工业互联网转移,大部分做大数据的厂商集中在怎么挖掘客户的画像行为轨迹,下半场更重要的是跟着国家的大战略中国制造2025、中国工业互联网的战略怎么把大数据应用到实体产业里,在工业互联网领域里推动大数据的发展。

  我们明年还会发布这样的报告,我们特别希望跟大家一块做好这个报告,我们发出诚挚的邀请,希望大家跟我们一块参与,帮我们做得更好。我们这个报告在编写和采集问卷的过程中得到了中国IDC圈的大力支持,很多渠道和后期工作的支持,同时很多数据中心会员单位也给我们很多无私的支持,在此一并感谢。我们这个报告的全文可以扫描二维码,在中国信通院的官网上可以全文下载,我的报告就到这里,谢谢大家。

  【相关链接

  中国大数据发展调查报告(2017年)

  随着大数据政策环境和技术手段的不断完善,大数据行业应用持续升温,中国企 业级大数据市场进入快速发展时期。互联网、电信、金融等开始实际部署大数据平台 并付诸实践,带动软件、硬件和服务市场快速发展。为进一步掌握中国大数据发展和应用情况,中国信息通信研究院开展了2016—2017年度中国大数据发展状况的调查。本报告以调查数据为基础,结合行业专家的访谈,力争详实客 观的反映中国大数据发展现状,为政府和企业了解中国大数据发展状况和制定相关决策提供参考,也为广大关注大数据的从业人员、专家学者和研究机构提供真实可信的大数据发展报告。

 

责任编辑:陈近梅

分享: