首页 专栏赵国栋正文

华住之后,数据泄露之殇如何遏制

今年3月,Facebook被爆出超过5000万用户信息被滥用,引发了全球对个人隐私数据安全的担忧。

近日,华住旗下包括汉庭在内的多家酒店,开房记录疑似泄漏,有暗网公开兜售相关数据。据称:“此次泄漏数量巨大,在公开的酒店信息泄露历史中前所未有,堪称互联网史上最大规模泄漏事件。”

隐私数据的泄漏近期频繁发生,严重影响了行业的有序发展。中关村大数据产业联盟秘书长赵国栋指出,数据泄露已经不仅是行业的难题,也是目前各个国家都在面临的社会问题和国家安全问题。

如今,大数据行业正在逐渐走向成熟,而暴露出来的问题也不容忽视,数据治理迫在眉睫。

缺少防范数据泄露的有效机制

数据泄露的问题由来已久,2018年更是集中爆发的一年。根据身份盗窃资源中心(Identity Theft Resource Center,ITRC)的数据泄露总结报告显示,2018年第一季度和第二季度遭泄露的数据数量已经超过了2017年全年数量的总和。在大数据时代的背景下,个人隐私数据被泄露、滥用似乎已经成为社会常态,难以避免。有网友调侃说:“在这个时代,谁不是‘裸奔’”。

这也许是人们享受网络便利的同时所付出的“代价”。在互联网时代,人们的生活基本上已经离不开网络,从某种层面来看,越来越多人们的工作和生活都离不开各种各样PC端和移动端的应用程序,而要使用任何一个应用平台都需要先上传姓名、电话号码、身份证号等个人信息完成注册,这使得人们的信息散落在各个平台、存储在各个公司。这些公司能否很好地保护用户的数据成为会不会造成隐私泄露的关键所在。

赵国栋分析称,被泄露的数据有两个主要来源。一方面来源于技术实力欠缺的企业,尤其是大量小企业,他们大多缺乏对数据安全足够的重视和充分的安全技术投入,更容易产生隐私数据泄漏的问题。另一方面,企业的破产倒闭也可能引发用户数据的泄漏。例如,在共享单车大战时,众多单车品牌涌现,它们采用免费、补贴等方式吸引用户注册,留下了大量用户信息,在共享单车的倒闭潮中,这些企业留存的用户数据怎么保护呢?这也成了数据泄漏的来源之一。

“数据的地下交易则是数据泄露的主要流通渠道”,赵国栋认为,这些因保护不力被泄露的隐私数据就是在数据黑产的推波助澜之下被肆意地窃取和贩卖。

但是不能因为隐私泄露和流通的洞口难以堵住就任由其泛滥,必须采取相应的措施来遏制,这也是赵国栋及其所在的中关村大数据产业联盟(以下简称“联盟”)所关注的焦点。

如何在法律框架下保护隐私数据?

为保护、引导互联网用户,维护网络安全,我国出台了网络实名制的管理规范,初衷是为了防止匿名在网上散布谣言、制造恐慌和恶意侵害他人名誉的一系列网络犯罪。但是,网络实名制以法律的形式强制要求互联网用户进行身份验证,而在公司破产倒闭等极端情况下,又缺少了保护个人数据的机制。为此,联盟推出“数联网”,作为行业的基础性平台,力图在法律框架下最大限度地保护个人隐私数据。

据介绍,“数联网”也叫“数据标识互联示范应用”,从字面意思来看,数联网不是数据之间的互联互通,而是将数据的标识进行连接、整合。赵国栋说:“数据和数据标识就像图书馆内书籍和目录之间的关系,数联网就是将每一个图书馆的数据目录汇集起来,而不需要整合书籍。整合之后,书还是存放在各个图书馆,但是通过数联网平台,你将知道你所需要的书籍被存放在哪一个图书馆。”同样的,数据被大量分散在不同的地方,通过“数联网”将这些数据的标识存储、联接起来,这在某种形式上也是实现了数据的互联互通。

那么,这个将数据标识进行联接的数联网是如何解决隐私数据泄露的难题呢?

“数联网”提供的解决方案是:将个人的身份信息转化成一个唯一的、外界无法识别的ID,这个ID就成为个人在网络上的身份标识,标识背后关联的是个人的身份信息;当个人在网络平台注册认证时,真实的注册流程就会发生变化,不再需要将个人的身份信息上传、留存在平台上,而只需要上传身份标识,并由和数联网系统关联的应用平台来对个人标识进行验证。

在这个过程中,应用平台只是保留了这个ID,不会存储个人的任何隐私信息,因此,就算企业保护不力造成数据的泄漏,也只是标识的泄漏,而这些标识脱离“数联网”将没有任何意义,大大降低了个人隐私泄露的可能性。

健全治理机制 让数据治理不再成为行业之痛

赵国栋表示,解决隐私数据泄露的社会问题是“数联网”的首要目标,但这并不是它的全部价值,“数联网跟社会的治理、个人隐私的保护、国家数据的安全、数字经济的发展是息息相关的,这才是其价值和意义所在”。从更深层的角度来看,“数联网”将会是数据治理的有效工具。

数据泄露只是数据治理面临的一个方面的问题,除此之外,打破不同企业、部门、地方之间的数据壁垒、数据割据,促进三大产业融合以及维护国家数据安全、数字主权也是“数联网”未来需要完成的使命。

在大数据行业迅速发展而问题也逐渐暴露的情形下,面对日益严峻的数据治理难题,“数联网”的提出无疑为此提供了一个解决的思路和方向,但从当前的行业条件来看,实际运行起来并没有那么容易。

首先,是技术实现上的难度。“数联网”的前提是统一数据标识,而不同的数据存储部门的标准是不一致的,例如男女的标识,有的用字母F、M表示,有的用0、1表示,没有统一的标识程序就很难识别。如果要用“数联网”建立大量的链接,还需要解决这些技术难题。

其次,“数联网”发挥更大的价值需要社会广泛的采用,这存在一个社会接受的过程。有能力保护用户隐私数据的大型企业是否愿意采用这个平台?社会能否接受这样的数据治理机制?这些问题尚需进一步的探讨,目前还只是迈出了实质解决问题的第一步。

另外,“数联网”涉及的面很广,如果能被国家正向应用,广泛地投入使用会给整个大数据行业带来巨大的变革;但如果被非法利用,则会给行业带来更深的安全隐患。“数联网”平台还需要正确的引导。

对于进行全面的数据治理,“数联网”具备实际应用的价值,但同时也要正视其还处在不断完善的阶段。要想充分发挥“数联网”的作用,则需要有效的监管,并确保数联网平台合法、合理的使用。为此,联盟发起筹备了“数据治理委员会”,旨在为“数联网”建立一个广泛参与的社会治理机制。

据介绍,“数据治理委员会”将会在9月11日由TalkingData举办的“T11”大会上正式成立,该委员会由联盟发起,并联合多家行业组织、大数据交易所以及地方政府等联合设立,共同维护“数联网”的有序推进。(数据观 孙永慧)

责任编辑:方茶云

分享:
数博故事
贵州

贵州大数据产业政策

贵州大数据产业动态

贵州大数据企业

更多
大数据概念_大数据分析_大数据应用_大数据百科专题
企业
更多