cover_image

数据隐私和区块链解决前景

铭达天下 铭达天下
2018年04月16日 09:52

图片


前几天facebook被爆8700万用户数据被第三方应用厂商获取,并被可能用于影响2016年的美国大选。其实,每隔一段时间,大型互联网公司或者机构都会爆出数据泄密事件,苹果icloud,网易几千万邮箱用户,linkedin1.27亿用户等,层出不穷。吃瓜群众会愤怒、鄙视、幸灾乐祸,一时间甚嚣尘上,然而很快就会重新归于沉寂。因为iphone你还得用,邮箱你还得发邮件,这么多邮件要挪起来得费多少工夫?再说就算邮件挪了一个地方,好像谷歌、微软、新浪都爆过邮箱泄密事件,搬邮箱之前我们是否也会问自己一个问题,世界上有安全的邮箱服务么?


所有事情发展到今天,都是各种因素复杂作用的过程,数据的安全和隐私保护到今天这样状态,也是如此。剖析问题,我们应该回到事物的本源先看一看。

信息

自从人类走出非洲,向全世界迁徙,直到占领整个地球,成为地球的暂时主宰,靠的是智人不断进化的大脑和人类个体之间的协同。人类个体间不断协作,原始部落的狩猎、需要人们之间商议围猎计划,协调分工,需要彼此之间准确地知道职责和分工。要知道,原始人类生存的地球环境险恶,动物凶猛,彼此之间表达不明确或者组织协调不要,很可能围猎不成,反受猛兽其害。于是在人类的发展过程中,产生了语言。可以在部落的人群中充分表达和传递信息,并且这个信息越来越精确。而彼此之间信息不能充分表达或者理解,不能产生良好协作的部落,在历史的演进过程中,已经被逐渐淘汰了。


历史上产生过人类很多分支,尼安德特人、爪哇人等等,在人类的进化史上都曾经出现过,有的从身体强壮度、脑容量等基因特质上甚至都比智人这一支强,但是却在与智人的历史交锋中,灰飞烟灭了。所以历史学家有一种观点,智人这一支最后能胜出,是人类的信息传递最高效,能够在人类的部落、族群中通过语言,营造一种想象的共同愿景,能形成大规模的行动协同。而其他人类分支正是在这种能力上的不足,虽然个体素质可能优于智人,却不能组织有效的大规模协同,而被智人最终碾压。有点像比特币的发展过程,很多人都以为比特币是人类历史上第一个加密货币,其实并不是的。在比特币之前的历史上,曾经出现过很多电子加密货币,只是因为加密算法、双重支付、当时技术条件等的限制,才没有发展出来,而比特币正好在2009年这么一个幸运地时间点,发展并壮大成现在世界第一区块链货币,而且以后的比特币分叉币,现在也几乎都归零了。从这个角度看,比特币是不是有点像人类历史发展上的智人,还能存活到今天而且日益发展壮大。


从我的认知角度看,信息是通过语言、文字、动作、实体等各种手段,减少不确定性,让人类个体、组织间达成认知共识,分工协同的高效工具。从人类的发展历史看,信息准确无误地传递,营造了人类的共同想象和愿景。因为技术条件的限制,在人类的农业耕种时代,远距离传递信息的工具是通过眼睛和耳朵。


比如中国抵御外敌入侵的长城上,当外敌入侵时,点上狼烟,让几公里甚至几十公里外的士兵看到,明确传递危险信息。而几十年前的一个非洲原始部落中,部族之间较远距离传递信息还是通过一种声音传递很远的鼓声,通过不同鼓点和节奏,类似于人类的莫尔斯电报编码,来传递一些需要及时交流的信息。

数据

人类进入工业文明后,信息的处理和传递的效率就有了飞速的发展。电报、电话的发明,让信息在人类社会的更大广度和深度上得到传播。但是从本质上说,这些工具只是提供了信息传递的快速通道和便捷手段,信息的处理还是必须通过人类的大脑来完成。形象的说就是用人类的大脑在挖掘信息中的价值,并将其转化为更底层的认知数据,并进行处理,是在脑力挖矿。后工业时代,人类中的很多精英一直致力于发明机械电力装置来代替人脑自动处理信息,并产生与人类预期一致的结果,于是计算机诞生了。

从计算机科学的角度看,人类的第一台计算机发明后,通过打孔纸带输入的信息就是数据,是以计算机能够处理的格式对人类世界的信息进行结构化后抽象而成的。所以数据就是对这个世界信息的抽象和结构化。

要让计算机能处理信息,设计人员必须具有计算机思维方式,数据之间形成结构化关联。计算机世界任何图片、视频、文字、语音最终都是一种数据的结构和展现形式。计算机短短几十年,特别是二十一世纪开始,互联网已经延伸到世界的每一个角落,触达到这个世界几乎所有的边界,将人类真正链接成一个实时在线的想象共同体,让人类世界的数据在这个巨大的网上高效高速流动,人类进入了信息革命时代。


数据
的生产

计算机能够处理的数据从采集、存储、处理、运算、输出、展现是一个很复杂的过程,各有各的应用场景。今天的主题是关于数据的隐私,所以就从对数据的采集和应用的角度阐述下数据的真个处理过程。

根据计算机的摩尔定律,计算机运算速度每隔18个月翻一翻,价格降一半,而存储能力也基本相同。现在人类世界每年产生的存储在计算机中的数据都是以前所有人类产生数据的总和。人类的知识、社交、购物、出行、交易、阅读等等几乎所有的行为,都被转化为数据,存储在计算机网络中,成为这个巨大互联网的一部分。也得益于互联网的规模和引力效应,成就了google,amazon,facebook,腾讯,阿里巴巴等这样的巨型互联网公司,他们给人们创造价值的同时,也得到了巨额的财富。

在上世纪计算机刚刚开始普及的年代,就有一些极客人物,通过各种发明,将自己的所有行为事件数据化。比如美国的极客圈中就流行过一种数字化生存实验,这些人头戴数字录像设备,记录自己二十四小时的所有行为,每做一件事情,都会严格在计算机中记录数据,同时定期将自己记录的行为进行数据化分析,甚至将自己的数据在极客圈分享,和他人找寻一些人类行为的共同点和数据模式。这应该是数据化采集人类行为的最早的开端。

数据
分析

我们知道,人类社会的规模活动,很多时候都是依据所获得的信息来做出判断和决策的,即所谓的数据分析支撑的行动决策。军事历史上有很多的故事都和数据分析决策有关。比如检查敌军阵营有多少锅造饭来判断敌军的人数规模,也有用这个锅的数量来迷惑对方错误判断军队数量以达到出奇制胜的目的。


涂子沛在他的一本有关大数据的书中也讲到过一个例子,美国独立战争期间,北方军队的一个将领需要带领他的部队急行军到几百公里以外的一个战场集结。但是军队的供给一直迟迟不到,但是时间不等人。这个将领在他掌握的数据信息中,规划了一条急行军的路线,居然在规定时间和没有供给粮草的情况下,按时到达了战场。他就是掌握了急行军路线上,每一个城镇的居民数量和大致经济状况,每到一个地方,就收刮所有居民的粮食和物资,以供军队即时作战使用,就是到达一地就地补给。虽然残暴了一点,但是战争时期,军队存活下来最重要,也是一个数据分析和决策的例证。

人类历史上,一直在寻求方法能够尽可能地收集数据,全面了解事物的状态,情况和周边影响因素,数据收集地越多,就有可能越接近事物的真相,才有可能做出最理性合理的决策。人类通过计算机系统采集、分析数据并作出决策,最有名和最早期的例子可能就是沃尔玛的啤酒尿布相关销售了。

啤酒和尿布放在一起,销量会提高很多(这个的解释是需要买尿布的时候,一般都是妈妈没空要照顾宝宝,打发丈夫到超市买尿布,而老公买尿布时一般都会顺便买啤酒慰劳下自己),或者是飓风来临时蛋挞的销量会猛增(尿布和啤酒的销量是逻辑推断正相关,而的销量无法推断逻辑关联,只能说是数据相关性),这样的数据密切关联性,让所有的公司都看到了信息数据化后的巨大利益挖掘潜力。


大数
据时代

google在2003年开始陆续发表大数据三篇奠基论文(GFS,MapReduce,BigTable等这个主题结束后,我会写写这三个内容)之后,人类的大数据时代开启了。在此之前,传统的oracle/EMC/IBM这样的高度中心化数据处理架构,已经没有办法满足越来越庞大的巨型互联网公司的发展需要。大数据技术、云计算、分布式技术的成熟发展,给这些公司带来了数据收集、存储和分析前所未有的便利。

任何商业的本质都是销售商品,获得利润,回馈股东。当互联网触及到世界上几乎每个人的时候,我们每个人都沉浸在其中,所有的行为都被这些网站采集和数据化。

google的现金奶牛产品还是搜索,它不仅要对全世界的几百亿网页进行及时的快照和存储,更是要对世界上所有每天使用google搜索几十亿用户的每一次搜索行为、习惯、关键词实时记录和分析,给他们快速搜索命中的网页,同时推送相关广告。

腾讯现在每天日活跃用户有十几亿,微信更是现在所有中国人必须每天使用的深度社交工具。甚至现在很多公司的工作安排、进度管理、文件传送审阅都是在微信上进行的。

阿里巴巴、facebook、amazon、滴滴、高德等等公司,都是一样,海量用户、海量数据、海量分析继续推动巨额收益。


数据
隐私危机

这几年普罗大众在享受互联网巨头提供的便利服务同时,也逐渐感受到了自身隐私数据被贩卖、交易、利用、泄露等情况,并逐渐变得无可奈何。

数据
“杀熟”

这种情况已经变得越来越普遍了。特别是购物网站或者机票销售,根据你的经济承受能力和支付意愿,给你看到的某个商品的价格或者机票的价格,会高于新用户看到的价格。因为这些网站已经形成你的用户画像,你对价格不是很敏感,又有历史上高概率支付的意愿。对于网站来说,当然是更高价格销售商品利润更高,但是如果你知道买的机票居然比别人贵,是不是有被欺骗的感觉。所有个性化服务,千人千面,就是用大数据杀熟客,屡试不爽。

我是滴滴的重度用户,就碰到过这样的情况。几个月前,和同事一起出差,动车到站,叫滴滴,滴滴给我一直在不断加价,1.3,1.4,1.5倍,还叫不到。同事说我也装个滴滴一起叫吧。于是他新装了一个,哪知他一装好,马上原价就叫到了一辆,而我的app上还在显示1.6倍加价倒计时。因为我在各个城市都经常加价叫过车。

数据
泄密


你会发现怎么我就在京东搜索过一款手机,还没有决定是否下单,在百度网站搜索资料的时候,旁边的广告栏就一直在弹相同品牌的手机广告。你刚在车管所登记了一个车辆号牌,刚前脚走出大门,马上就接到一个车辆退税的诈骗电话,“您好,您的车牌为XXXXX的车辆符合国家退税标准,请。。”所有各行业,都在把用户数据进行交易、买卖,甚至流入诈骗团伙手中,数据泄密事件层出不穷,有很多,其实都是在数据交易和互换,要获得更多的数据,才能产生更大的利润。不久的将来,骗子太多,傻子可能都不够用了。

数据
诱导

当你的数据已经被采集地足够全面后,购物完整会大概率知道你接下去想买什么,甚至在你购物意愿不清晰的时候,诱导你现在应该买什么。所以很多时候,当你只是想买一颗钉子的时候,发现最后怎么在某宝上买了一个厨房四件套回来。

你很有规律地在某宝上定期买套套,但是前几天你和女票分手了,今天某宝还给你推送了你常用的套套牌子,你才知道,按照规律,你的套套应该买了。什么时候是某宝规定了你要什么时候用套套了?对,这个时候某宝最想采集的是你和女票合适分手的这条数据。这条数据移动运营商那边大概率会有。

数据
监视

自从斯诺登事件以后,地球上的人才知道美国的棱镜计划,监控了所有美国境内的电话、邮件和全世界政要的通话等数据,以反恐的名义。互联网巨头也早就形成了用户的数据画像,你的行为,你的各种习惯等等,对于互联网这些巨头来说用户其实就是一堆的数据,组成了你这个人,只要需要,你随时可以被监控,因为你带着手机,gps随时被采集,因为你支付电费,你接受快递,你有几个家互联网巨头最知道。就连你的性取向,他们也一清二楚。如果有需要,你的数据就会被拿来交易和监控。

如果你没有被监视,不是他们监控不了你,只是你不值得被监视。

数据
操纵


文头facebook被爆的数据泄密事件,其实最终的用途就是数据操纵,通过社交关系和互动,大数据分析,被用来操纵用户心理,甚至改造和影响用户心理,精准操纵用户投票心理,操纵大选投票结果。亚马逊通过买书,甚至可以把一个白左逐渐改造成保守右派。所以你以为是按照自己的意愿在投票,实际上你已经被心理操纵,你以为你在看书精进自己,实际上已经被亚马逊推荐的图书逐步改造。

数据
安全的困局

目前的世界,数据运行状态基本还是政府、大公司主导,集中存放和管理。风险也是显而易见的:

坚守自盗。无论他们宣称数据有多安全,作为最终的数据管理方,总是能拿到最原始的数据,安全全靠他们自己的信用背书,但是他们的信用如何,大家都有感知。

外部安全攻击风险。目前互联网服务的安全结构太过复杂,而复杂的结构更带来了安全漏洞的叠加。历史上,即使最庞大资金最雄厚的互联网公司,都曾经暴过安全事件。黑客不断攻击,安全事件层出不穷。

数据产权归属不清。用户认为这些个体行为产生的数据应该归个体所有,而互联网公司在所有用户使用协议上都已经宣称用户在使用他们的服务时被采集的数据都是归公司所有,其产生的收益更是公司巨额利润的来源。

科斯定理,用户数据应该效益最大化,谁用得最好,效益最大化的情况下,双方在收益上取得一个收益分配的平衡。很明显个体的大量汇集才产生了规模效益,如果个体割裂开来,根本产生不了效益,但是如果让互联网巨头主动让渡一部分既得利益,个人和巨头们应该如何让渡和分配,也是一个迷人的问题。

区块
链隐私数据解决前景

比特币底层技术区块链这几年蓬勃发展,也充分验证了从数学逻辑底层原理上,保证了数据加密后,只能由私钥来存取这样的操作是安全可行,且不受第三方控制的。

数字化时代,我们每一个人已经不可避免地被数字化,变成了一堆数据的合体。而区块链技术,可以在充分保护个人数据隐私的前提下,让每个人考虑如何用自己的隐私数据为自己谋得应有的权益。而不是像现在这样,被互联网巨头们肆意采集、消费和操纵。

数据
隐私加密基本原理

其实很简单,就是对每一项个人数据,用类似比特币秘钥生成技术原理,对数据进行加密,然后只有个人秘钥可以存取,或者个人授权的第三方机构可以存取,同时设定智能合约访问时间有效期和数据颗粒度。

应用
实例

图片


在我有限的区块链项目接触认知范围内,公信宝的布洛克城项目已经初步实现了这种功能。让用户通过授权访问淘宝,支付宝、京东、邮箱信用卡、手机号码,刷脸识别等隐私数据,提升挖数字货币算力,以数字货币挖矿收益交易用户的隐私数据,并可以让用户设定数据访问的有效期限。


这样,用户可以自己权衡,你的个人隐私数据和数字挖矿的收益相比,到底值不值当。如果你觉得自己的隐私也不值什么钱,薅点羊毛也不错,那你就把自己的隐私数据释放到公信宝平台,参与数据交易,如果你觉得自己是大人物或者看不上这些羊毛,那就没人能获取这些数据。还有如果哪天你想反悔了,那么数据访问授权的时间到了,你还有机会向公信宝取消数据访问授权。

区块
链数据隐私保护的生存技能

区块链技术对数据隐私的保护给我们提供了一个可行的解决方案,但是作为用户,也必须有充分的认知和方法才能真正保护好自己的隐私。

要对隐私数据的颗粒度划分足够细。要知道任何公司都是想要能访问你全量信息的不竭冲动。你必须对自己的数据颗粒度有足够认知,比如谁可以访问你的购物详细记录,谁可以只能访问你的年龄性别,谁可以只访问你是否有高血压病史等等,你必须对这些数据足够细颗粒度,才能充分掌控和管理隐私。

不要充分相信。不是所有宣称自己做区块链项目的公司已经做到了对用户隐私数据的加密,为了取得效率优先,很多区块链项目只是部分或者根本没有加密用户数据,还是采用传统的中心数据库存储管理用户数据(话说币乎是不是还是这样的情况),和传统的互联网巨头一样存在安全风险,目前状态下要有充分准备。何况就算你授权给公信宝第三方访问,公信宝第三方会否再把你的信息拿出去买,就不得而知了。


学习数据管理的智能合约机制。未来,对数据管理颗粒度和访问越来越精细的情况下,在数据的整个生命过程中通过智能合约管理,时间、授权范围、访问条件限制等等,都会是一个复杂机制管理,要想管理得好,就要充分了解学习智能合约。这个应用技能,会是将来区块链世界一大杀技。



继续滑动看下一个
铭达天下
向上滑动看下一个