来源:数据观 时间:2018-07-11 16:37:42 作者:魏芳
人工智能到现在已经经历了几十年的发展,在上世纪五十年代的达特茅斯会议上,“人工智能”一词被正式提出,这被看作是人工智能正式诞生的标志,同时,人工智能的发展潜力也被寄予厚望。但是它的发展并不是那么顺利,经历了几次高潮到低谷的跌宕起伏。
人工智能再次进入蓬勃发展时期
近几年,得益于技术的进步,人工智能再次达到发展的高潮。一方面,深度学习技术的研究成果突破了人工智能的瓶颈,引爆了人工智能的发展。另一方面,在互联网时代下,大数据技术的不断完善,使数据得以迅速积累,为人工智能的研究提供了数据基础。同时计算机算力的不断提升、硬件费用减少等外在因素也为人工智能的前进提供了便利条件。
我国在人工智能的研究与应用进程中属于后发者,起步相对较晚,但在这次发展浪潮中也取得了丰富的成果和突破性的进展。可以看到,现在人工智能的技术成果已经渗透到企业和人们生活的方方面面。除了技术研究的进展,这也有赖于我国自由宽松的发展环境和充分的市场需求。
从整体上看,我国正在大力地扶持人工智能产业的发展,例如2017年国务院发布《新一代人工智能发展规划》,将人工智能提升到国家战略层面,同时各地方政府和相关部门都相继出台政策和规划方案,吸引人工智能企业的入驻,希望借此拉动当地经济的增长。这为人工智能的发展提供了良好的政策环境。
从产业的市场环境来说,对企业而言,智能化意味着效率的提高和利润的增长;对于个人则意味着便捷、省事和更个性化的服务。而在此基础上,企业业务和人们日常生活对智能化的程度仍然在提出新的要求,这是推动人工智能不断前进的内在动力。
由此应运而生的,是越来越多的初创企业在孵化,同时也推动着其他领域的企业向人工智能转型,或者开拓人工智能相关业务。达观数据作为一家人工智能企业,专注于文本智能处理,也正是因为上述因素有良好的发展土壤。
用文本智能处理实现“机器代人”
文本智能处理,也就是自然语言处理,是人工智能的一个分支。它试图让机器来理解人类的语言,通过模拟人脑的机制来解释文本。
在大数据时代,这个高速前进的发展阶段,每一个企业都存在着大量文字文本,尤其是法律行业、金融机构、媒体等行业,需要对文本进行审核、分类、提取关键词等。
以金融机构为例,有大量的合同、文书等文件需要审核其中的流程,判断其中是否存在问题。比如数字是否一致?有没有法律漏洞?有没有不合企业规范、不合金融行业监管要求的地方?经过大量训练后的计算机,则可以完成其中的绝大部分工作,处理完后再交给人去把关。在这个过程中职员就可以从日常繁琐的文字工作中解放出来,去做更有意义、更有价值的工作。
当然,这样的场景绝不仅限于金融行业,包括法律、媒体、快消零售等行业,都存在着类似的重复枯燥的巨量文本文档处理任务,都需要文本智能处理提供“机器代人”的解决之道。目前,文本的智能处理主要应用在智能问答、机器翻译、文本分类、文本摘要、标签提取、情感分析、主题模型等方面。
达观数据瞄准的正是这些潜力场景,为数字化转型升级期的企业提供文本挖掘、知识图谱、搜索引擎和个性化推荐等文本智能处理技术服务,帮助企业实现数据化、智能化运营。
文本智能处理有广阔的前景也有挑战
依靠深度学习等技术,文本智能处理已经为很多行业带来了明显效率提升,作为前沿技术也发展得很快,但这并不代表已经达到了完美的结果。文本智能处理未来将会有广阔的发展前景,但同时也需要正视它目前所面临的挑战。
在当前的实际应用中,图像和语音的分析处理能够达到更高的精准度,这是因为图像、语音可以直接转化为计算机可以理解的对象。但是自然语言是人类在认知发展过程中产生的高层次抽象实体,计算机并不能完全理解其中的含义。虽然从达观数据的业务经验来看,利用文本智能处理进行合同审核,平均准确率可达到90%以上,甚至一些简单的人物可以实现100%。当然,这个过程是需要机器的智能识别和人工复核相结合,所以准确度受到数据质量的好坏、是否是结构化的数据以及审核人员的疲劳度等因素的影响。但是在目前大多数的应用场景中的精准度还需要提升,这是文本智能处理在业务层面的挑战。
在技术上也存在难度。对文本进行语义理解需要结合上下文的语境和说话人的情绪。比如在人类的交流中,相同的一个词或一个句子,用不同的情绪和表达方式说出来,会产生差异极大的含义;而文本处理涉及到的语言也非常多,除了标准语言,还有俗语、俚语以及现在流行的嘻哈语言、网络语言等,这都给文本的处理增加了难度。同时,人的语言也处在不断地发展中,随着发展,人的语言的逻辑思维也会发生改变。文本处理的相关技术都是基于已有的数据在做训练,但只要有所变化,就需要按照新的语言规则去学习。
而在这个领域中,包括达观数据在内的企业都属于探路者,未来这个行业会发展成什么样子、发展体量有多大等,这都是不可知的,没有前人的现成经验可循。而且,现在社会、技术的发展速度很快,企业需要在技术、产品和服务等方面不断突破,需要快速对新的发展和客户新的需求作出反应,才能跟上社会发展的步伐,才能在行业中保持领先性。
这些都将是行业在前进过程中需要突破的瓶颈。但是,相信随着技术的进一步突破,这些难题将不再成为制约行业发展的阻碍。
(作者:魏芳,系达观数据副总裁)
责任编辑:陈近梅