首页 资讯正文

专访|DataFountain陈娟:数据科学人才的培养需要实战训练

在大数据和传统产业的深度融合的过程中,催生了各类的数据竞赛,国内企业,尤其是互联网企业也对此投入了越来越多的注意力对于企业来说,组织数据竞赛无外乎三点需求,一是推动公司内部的技术创新,二是发掘引入新的技术人才,三是希望自己的技术品牌能得到业界的广泛认可。

这也是数据竞赛兴起的原因所在。大数据应用场景的不断开发,随着而来的业务难题也开始涌现,数据竞赛能在短时间内组织起全国乃至全球大量优秀的数据科学人才,来共同应对这些问题并提出解决方案。同时,在竞赛中表现突出的参赛者也成为企业关注和争夺的技术人才。

但数据竞赛行业要想获得持续的发展,背后需要学界和产业界的繁荣做支撑以及源源不断的数据科学人才的供应。而北京数联众创科技有限公司(以下简称“数联众创”)联合创始人陈娟认为,其实中国很多企业的信息化都还没有完成,从数据竞赛的要求来看,他们的数据完备度还不够,还无法通过数据来支撑业务或者运营;而在人才储备方面,国内具备数据科学家能力的人才也还十分有限。

在陈娟看来,这也是数据竞赛平台这个赛道还未被外界熟知的原因。那么,数据竞赛平台的发展出路在哪里?

数联众创旗下运营的DataFountain平台是国内专业的数据竞赛平台,经过三年的发展逐渐得到行业的认可,是国内头部客户的首选。但陈娟表示,数联众创未来的发展战略是要将数据竞赛平台转型成为数据科学家工作平台,在继续服务于数据竞赛的基础上,将花费更多的精力来打造一个沟通数据科学人才学习、生产和产业的项目众包平台。

和单一的数据竞赛平台相比,在业务和目标得到深化的数据科学家平台一方面为大数据产业的发展包括数据竞赛这个领域的发展培养更多的人才;另外一方面数据科学家在成长的过程中也为产业的发展提供了更多的解决方案。

数据观采访到数联众创的联合创始人陈娟,为大家解读DataFountain平台转型的内在深意、转型过程中可能遇到的阻碍以及数联众创的应对方式。

公司简介:

数联众创于2015年6月成立,并一直在运营DataFountain数据竞赛平台。其企业创始团队主要来源于中科院计算所,并参与组织了国内第一个大数据竞赛,也就是现在中国计算机学会(以下简称“CCF”的大数据与计算智能大赛(当时叫做“大数据创新与创业大赛”)。

2016年DataFountain开始承接CCF大数据与计算智能大赛,并作为官方指定竞赛平台。

专访|DataFountain陈娟:数据科学人才的培养需要实战训练
 
北京数联众创科技有限公司联合创始人陈娟
 

战略转型升级 加强人才储备是关键

数据观:请简单介绍一下DataFountain这个平台。

陈娟:DataFountain是一个专业的数据竞赛平台,主要是承接业界各种类型的数据竞赛,将各种各样跟数据科学相关的技术性难题发布到平台上,吸引全球有数据解决能力的数据科学家来解决这些问题。核心赛事都是以算法为基础的,包括数据挖掘、分析建模,识别和预测等,也包括一些数据类产品的创新问题。

18年之前,公司定位为数据科学领域专业的数据竞赛平台,但是在未来的发展规划上,我们计划把这个平台升级成为数据科学家学习及工作平台,这个是公司战略上的变化,也是19年战略重点。

数据观:作出这样的战略改变是出于哪些考虑?

陈娟:一方面是基于公司的愿景,是希望用数据、算法和人才为数据科学家和产业提供链接和服务,为我国培养大量的数据型人才,同时带动产业的数据生产能力、数据创新能力。

具体来说就是通过DataFountain平台积累的人才优势、数据优势以及算法优势来帮助入门的数据科学人才成长为一名能够适配产业的数据科学家,同时也通过我们的人才力量去帮助企业解决问题。

作为单一的数据竞赛平台,DataFountain服务的对象包括BAT、IBM以及国家电网、兴业银行等科技巨头或上市公司,更多的是一些企业。除了头部科技型企业,我们更希望能为整个行业服务,为所有的数据科学人才服务。

另外一方面,目前国内的相关人才是缺乏的,可能平均100家企业里只有两家才有能力吸引数据科学家,而未来市场对于这部分人才的需求是巨大的,人才缺口的巨大,未来所有的企业都将是数据驱动型企业,DF希望能弥补人才短缺的鸿沟,能为中国的所有企业培养未来的数据人才,成为未来中国数据科学家的摇篮

数据观:跟数据竞赛平台相比,数据科学家平台有哪些不同?

陈娟:首先在业务上会有深化和扩展,除了继续承接竞赛,还会衍生出更多的活动模式,主要包括以下几个方面:

1、构建一个众包项目的平台,承接一些企业和政府的项目,由平台上有能力的数据科学家用户提供解决方案。并且在此基础上提供协作的工具,让大家可以共同在平台上完成不管是竞赛项目还是众包项目。

2、打造一个数据科学人才交流互助的社区。让一些有输出知识能力或者在某些方面有专业技能的数据科学家在平台上分享技能经验,而在解决工程问题时遇到困难的人可以在这里寻求帮助。

3、打造一个数据科学家成长平台,配套我们原有的竞赛业务,并将竞赛做一个从初级入门、中级入门到高级入门的梯度分类,入门的数据科学家可以在平台上通过完成竞赛来打磨自己的实战能力。当具备足够的能力之后就可以在平台承接具体的项目。

另外,用户的存在形式也会有所改变。除了单个的用户、单个用户组成的团队,可能还会有企业团队入驻。未来更多的是以数据科学家、数据科学家团队或者数据科学家企业这样的形式存在。

数据观:在打造数据科学家平台的过程中,可能会存在哪些阻碍?

陈娟:其实对于一个企业来说,任何一次转型或者说业务的升级都会遇到不少阻碍和困难。但从数据科学家平台主要的增长瓶颈来看,我们最担心的是未来会面临一个青黄不接的状况。

数据科学家的培养需要DF这样的开放众包平台,提供资源的汇聚、提供实践的环境、提供一个培养的正确导向。还需要产业中已经走到前端的企业输出自己的数据、算力和人才,未来这些企业的开放程度将直接决定我们数据科学家的培养速度。

这个是社会和机构的弊病,我们正在试图改变这样的现状,加强数据科学人才的培养。因为只有人才培养好了,我们才能去做更多众包方面的事情,才能更好的去解决全行业企业的问题。

数据科学人才培养 实战训练是最佳模式

数据观:目前国内数据科学家的储备和培养情况怎么样?

陈娟:现在国内具备数据科学家能力的人其实是相当有限的,根据最近的行业报告,可能是刚刚30万出头,这还远远不能满足行业的需求。

除了企业,现在国内很多高校都在做大数据和人工智能等相关人才的培养和教育。但是高效的人才培养模式仅仅是理论的普及和一般能力的培养。未来这些人才无法真正产生

数据观:DataFountain想要培养什么样的数据科学人才?

陈娟:我们希望培养的数据科学人才是要具备快速上手解决企业实际问题的实战型人才、快速的解决现实场景中的工程问题或者有单个业务突破的能力。我们更多希望把人才培养成这样一个方向,这样的人才是在高校教育体制下是培养不出来的。

数据观:DataFountain如何解决平台缺乏数据科学人才的难题?

陈娟:既然未来DataFountain的定位是数据科学家平台,那在没有足够的数据科学人才储备的情况下,第一步肯定是要加快和加强相关人才的培养。对于有一定数据科学基础的用户,可以通过参加竞赛或承接平台上的众包项目来不断提升业务能力;而针对完全的小白用户,我们还将推出实训平台,让这类用户在平台上快速入门。

总的来说,就是用实战训练的方式来帮助数据科学人才的快速成长,变成一个有业务实战能力的人,这在我们看来是人才培养最有效、最实用的方式。

数据观:实训平台的培训方式是什么?

陈娟:其实跟竞赛差不多,只是从线下的环境搬到了线上,并且里面还会有来自剑桥、中科大等名校的博士在上面做一些案例的串讲。

一个完全小白的用户成长为数据科学家,可能会面临无数的难点,可能在安装工具上就搞不定。而DF平台可以汇集成一套大家普遍通用的工具和环境并且在平台上开放教案。通过讲解和做任务的方式帮助小白用户入门,我们觉得这也是一个很好的培养人才的方式。

数据观:数据科学家未来的发展方向是什么?

陈娟:随着对这个行业的认知越深入,我们越觉得未来的数据科学家会是一个非常独立的个体,不依存于某一个企业,也不依存于企业传统的管理模式。所以我们当时为什么想起来做数据科学家平台,就是希望这个平台能改变这个社会组织模式和生产模式。话句话说,就是人才不一定是要被绑定在企业里才能去做工程项目、才能够去产生价值为企业和社会服务。

数据科学家是一种非常轻量的工种,所以它未来一定是要依托于这种大型的平台,来输出自己的算法、模型和自己解决问题的能力。因此通过众包的模式去应对未来即将爆发的这种人工智能和大数据产业的机会。

(数据观 孙永慧)

责任编辑:李兰松

分享: