首页 企业国双科技正文

数据观专访国双科技黄勇坚:大数据时代 基于“视角”才能解决企业痛点

  2016年12月24-25日,以“数据驱动,智见未来”为主题的CCF大数据与计算智能大赛决赛暨颁奖典礼在青岛举行。11个出题企业与科研机构分别设立了11道大赛赛题,最终甄选出55支参赛队伍前往青岛进行最后的激烈比拼。大赛中,数据观记者专访了北京国双科技有限公司技术副总裁黄勇坚,深入了解此次大赛规模、参赛选手表现及赛题解读等。

数据观专访国双科技黄勇坚

  数据观记者:国双在本次大赛中扮演一个什么样的角色?具体做了些什么?

  黄勇坚:国双连续二年参与CCF大赛,在本次大赛中既是赞助商也是主要出题方之一,2015年国双出的赛题是《判决文书中的金额项提取》,该赛题获得了综合大奖和组间PK第一名。由于这项活动是产学深度合作很好的模式,赛题研究成果可应用于赞助方当前的工作项目。国双司法大数据和司法人工智能领域的解决方案和产品中部分已体现相关应用。通过自然语言处理技术,对公开的判决书进行解析,分析文书中的原告、被告、案件事实、法律依据、判决结果、胜诉率、赔偿金额等上百种维度和指标,建立这些维度和指标的关联,挖掘各类案件发生的规律和情况,为法院有效掌握全国司法情况,基于大数据作出准确决策提供了有效的手段。

  2016年,国双第二次作为出题方发布了名为《基于视角的领域情感分析》的赛题。

  数据观记者:怎么理解《基于视角的领域情感分析》这个赛题?

  黄勇坚:国双出的赛题主要是针对国双客户在现实中的真实痛点而制定的。国双针对汽车行业有专门的汽车解决方案,在国内有大量汽车客户。比如在汽车行业,汽车客户非常注重在互联网上的舆情口碑分析,通常想买车的消费者会在微博、微信或者网站上进行发言和评论,相互讨论汽车的车型、价格、功能。如“A车比B车好”,对A而言是正面的,对B而言是负面的;“C车内部空间大、但油耗也很大”,对C车的空间这个属性而言是正面的,而对于C车的油耗这个属性而言是负面的。

  市场上很多厂商的解决方案是对整句话进行正负面的情感判断,而不是基于特定的视角。“A车比B车好”,因为有一个“好”字,就会认为整句话都是正面的,根本不区分说的是A车还是B车,这样就没什么商业意义。为了解决客户的痛点,国双提出了“基于视角的领域情感分析”,即通过机器学习的方法让计算机自动拆解并找到句子中所针对的每一个视角,再让计算机判断每一个视角的情感,商业意义大大提升,可以为企业客户提供更准确的信息。

  数据观记者:国双选择这个赛题除了解决企业真实痛点外,是否还因为国双在这个领域有领先技术和研究成果?

  黄勇坚:自然语言处理是一个基础而综合的研究方向,在学术界非常有研究价值,同时在商业上也非常有市场价值。国双已经在机器学习和人工智能领域作了大量的研发投入。为此,国双联合国内在这些领域有深入研究的高校进行产、学、研合作。国双与哈工大、中国人民大学信息学院均有合作关系,共同成立联合实验室,共同进行大数据和自然语言处理方面的人才培养和将学术成果商业化的工作,既解决了企业实际的产业问题,同时也促进了学术研究。国双在这个领域本来就积累了很多经验,这次的大赛也让国双看到了学生的创新能力,学生的力量给企业带来了不少新思路和创意,令人振奋。

  数据观记者:在2016年,国双这个赛题的研究成果会被应用到哪里?

  黄勇坚:国双近期着重于汽车行业,为汽车客户解决舆情识别、舆情监测、知识挖掘的问题。我们看到学生运用某个算法模型解决类似问题。这个算法的特色是具有很好的可复制性,因为它不是基于规则的,而是基于深度学习的。这个算法可应用到包括汽车行业在内的各种领域,例如金融领域,特别是上市公司的场景。在互联网中存在的海量信息,有些信息可能对某些上市公司是利好,但相对的可能对于某些公司是利空,合理的算法可以凭借基于视角的情感判断来进行分析。

  数据观记者:您怎么评价今年大赛和参赛队伍的表现?

  黄勇坚:今年大赛规模比去年大了很多,参赛选手实力也越来越强,竞争也越来越激烈。相比去年,本次赛题难度有所提高,赛题也增加到11道,整个大赛都在进步。大赛能够解决企业实际应用问题,能让企业发现一些优秀人才,对培养中国大数据方面的人才非常有帮助。

  同时,对于本次国双参赛队伍的表现我也很满意。获得本组赛题一等奖的参赛队伍,他们研究出的模型是一个完全基于深度学习而没有依赖具体领域规则的模型。具有通用性,可以很容易迁移应用到其他业务领域中。模型能完美和国双积累下来的很多规则结合,有非常良好的落地性和商业价值。

  数据观记者:您觉得大赛是否能成为解决企业数据创新和突破的有效手段?

  黄勇坚:企业要有数据创新和突破首先需要的是人才,最有效的办法之一就是通过大赛寻找到这样的人才。

  大赛的机制是由企业出题参赛,选手针对赛题进行比赛,这样能使参赛选手在竞赛全程与赛事工程师建立一对一沟通渠道,这也是企业直接接触到人才的渠道。

  竞赛选手能在大赛中给予企业很大惊喜。他们思路非常创新,一些创意点是企业可能想不到又具有实际运用价值的。中国发展大数据产业需要非常多的人才,依靠大赛的规模和影响力,对整个国家培养大数据人才非常有帮助。(数据观记者 付娇)

责任编辑:陈近梅

分享:
延伸阅读
    大数据概念_大数据分析_大数据应用_大数据百科专题
    贵州

    贵州大数据产业政策

    贵州大数据产业动态

    贵州大数据企业

    更多
    “智慧中国杯”全国大数据创新应用大赛
    企业
    更多