来源:数据观 时间:2017-05-02 11:23:01 作者:杨皓钧
数博会“黑科技”提前看 比尔·盖茨都曾高度评价——
不用出声!唇语识别技术知道你在说啥
2017数博会目前已有近250家企业确认参展,展览会上,诸多难得一见的“黑科技”将面向公众亮相。其中,海云数据将带着他们最新的唇语识别技术参加展览,比尔·盖茨都曾到访并高度评价的企业,你也有机会一睹“庐山真面目”。
海云数据被称为中国大数据可视分析的领导者,提供企业级大数据整体运营与分析服务,依托于计算机数据视觉、数据算法等技术,探索大数据的潜在商业价值,为不同行业客户提供基于数据交互可视化的整体产品,真正实现将大数据应用于分析、决策和预判领域。
2016年11月,Google旗下的Deepmind发布了一篇唇语识别研究论文,识别的准确性大幅度超过人类专家,成为人工智能超越人类的又一个领域。而海云研究院自2016年12月以来,成功复现了Deepmind发布的研究成果,同时开展了中文唇语识别模型的研究工作,取得了一定的成果。目前看来,中文识别模型有望在准确性上超过Deepmind发布的英文识别模型。海云数据称,将在今年上半年公布研究成果。
目前,海云数据的唇语识别技术的中文准确率已达到71%,英文准确率高达80%。
据了解,唇语识别是一项集机器视觉与自然语言处理于一体的技术,目的在于直接从有人讲话的图像中识别出讲话内容。唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征;随即将连续变化的特征输入到唇语识别模型中,识别出讲话人口型对应的发音;随后根据识别出的发音,计算出可能性最大的自然语言语句。
训练唇语识别模型,需要用到大量的语料,这些语料是经过处理的有人讲话的视频,以及视频中每个讲话的口型所在的时间点上,对应的讲话内容文字。可以使用来自视频网站的公开视频,但是这些视频不能直接使用。利用视频制备语料,首先需要对视频进行筛选,把说话人不在画面中的部分去除,然后分离出筛选后的视频中的语音,将语音识别成文字,最后将识别出的文字对齐到语音中相应发音的时间点上。
海云数据目前已创造出全新的大数据运营产品“图易”、“智驾”、“ DIVA”、“智警”、“慧务”等多个产品。微软创始人比尔·盖茨曾在造访海云数据时评价道:“这是一支充满激情的团队,形象化数据是商务智能的重要组成部分,我对海云数据的数据分析能力印象深刻。”
今天,海云数据的产品被世界500强企业所广泛使用,并进一步推动了大数据可视分析的商业应用市场空间。
2017中国国际大数据产业博览会(简称2017数博会)将于5月26日-29日在中国贵阳召开。数博会展览、论坛以及系列活动将于5月25日开始举办。自5月25日起,北广场及登录大厅的专业发布区和精英发布区以及展场会议室,将分别举办大数据领域权威发布活动和企业新产品、新技术的发布专场,为参展企业提供业内最具专业水平的展示发布平台。想参观2017数博会专业展的观众可通过数博会官网、官方微信进行购票。
(通讯员 杨皓钧)
http://www.cbdio.com/zhuanti/node_8880.htm
【关于数博会】
数博会作为全球首个大数据主题博览会,秉承“国际化、专业化、高端化、可持续化、产业化”的核心理念,旨在为全球范围大数据领域专业人士和企业提供行业前沿资讯、热点动态以及合作交流平台,促进大数据行业的技术发展和应用。数博会已成为全球大数据领域的盛会。
2017中国国际大数据产业博览会将于5月26日-29日在贵阳市举行,它将继续聚焦大数据的探索与应用,展示大数据最新的技术创新与成就,成为中国最具国际化和产业化的高端专业平台。
数博会官方微信二维码☟
责任编辑:陈近梅