我该如何从互联网“夺回”自己数据的所有权？

原创傅一平与数据同行 2021-10-16

收录于话题 #数据安全的思考 5个内容

这是傅一平的第273篇原创

作者：傅一平

个人微信：fuyipingmnb

今天来谈一个可能是异想天开的问题，所以在标题中把“夺回”标注上引号是因为关于互联网数据我们其实没有真正拥有过，又何来夺回呢？

但互联网数据的所有权的确是个值得探讨的问题，就来简单谈一谈。

“网络已经演变成一个充满不公平和分裂的工具，它被利用来谋取私利，如今，我认为，我们已经达到了一个关键的临界点，向更好的方向进行强有力的改变是可能的—也是必要的。” “万维网之父”蒂姆·伯纳斯-李在创业公司inrupt的博客文章中发表了上述言论。

伯纳斯-李这么说的时机可以说再好不过了，从数据分析公司Cambridge Analytica利用Facebook的数据在总统竞选中期间锁定美国总统唐纳德·特朗普(Donald Trump)的选民，到谷歌旗下社交网络Google+出现数据泄露，导致数十万毫无戒心的用户的私人信息流出，过去几年数据隐私丑闻频传。

至少可以说，互联网隐私和安全是热点问题，用户似乎正迅速失去对那些在数字时代创造互联网神话的公司的信任，我们需要寻求解决方案。

那么，互联网这个原来崇尚公开、透明、分享的技术是如何一步步陷入隐私和安全的困境的？

最早互联网的诞生，是为了解决军队之间的沟通问题，如果指挥中心被摧毁了，大家依然可以通过电脑取得联系，所以互联网的本意其实是去中心化，最早的网络底层协议都是免费公开的，因为在互联网发展初期，大多数人都不知道它的存在，开放协议的做法是为了让更多人参与进来，比如发送电子邮件消息的SMTP协议，我们熟悉的Http协议等。

随着对互联网越来越多地关注和使用，大家开始在网页上获取信息，互联网进入1.0时代，那个时候，网站是不记录用户数据的，这使得在网上经商几乎不可能，因为你不知道谁来过，买了啥，电子商务就没办法做。

后来网景公司制作出了一种叫cookie的技术，可以辨别用户身份，当做数字消费记录器来使用，于是出现了一批新公司，成为了用户网络数字行为的记录者：Google记录网站和用户的搜索行为；Facebook记录用户的身份和互动行为；亚马逊收集信用卡号码和购机行为，这就是Web2.0时代，这些记录的用户数据，用来精准投放广告再适合不过了，而且数据越多，广告收益越好，所有这些大互联网公司，都对囤积用户数据趋之若鹜。

有了商业利益，资本和技术就大量的进入这个领域，同时为了独占利益，大家开始选择独占技术和商业模式，同时借助身份认证、社交媒体和支付机制等手段进行圈地，世界上数十亿人的信息，包括身份、位置、兴趣、消费习惯、消费能力、社交网络等等，逐步被汇聚到了少数几家大公司的数据库里，而信息，是网络商业里最核心的资产。

巨头掌握了个人信息后，基于这些数据的分析，了解了你的需求和喜好，就可以把特定的信息和广告在核实的时间推送给你，这就是他们的盈利模式，资本的力量越大，就越能控制互联网，技术能力越高，就越能控制互联网，借助互联网的力量，赢家通吃的模式被发挥到了极致。

可以说，互联网从web1.0演化到web2.0几乎是必然的，这既不是个人或互联网巨头的道德问题，也不是互联网法制建设不完善的问题，而是互联网本身的结构性问题。

但对于普通人来说，我们则失去了自己信息的掌控权，这是互联网发展的副产品，商业总是逐利的。

人工智能曾经提到一个美好的场景，在未来，你一出生就将拥有一个智能助理，它记录了你的一言一行，根据你的偏好规划你的一切，甚至在你走后还可以作为财富留给自己的后代。

但要实现这个东西，按照web2.0的规则，得首先问问互联网巨头愿不愿意！

对于普通人来讲，现在的网络技术里，其实我们的数据资料、数字身份都不在自己手里，而是掌握在互联网巨头手中，但我们自己需要进行身份认证的时候，却只能通过繁琐的程序，向这些巨头或机构申请，换句话说，我们在网络上的个人身份，并不属于自己，而是属于科技巨头，每次要证明自己的时候，是需要去向巨头们借用数据，用完再还回去。

比如你要使用某个APP，它可能就会提示你，为了确保服务质量，你得允许这些数据被相关的第三方使用，因为APP的服务质量需要这个第三方服务来保障，当你向信贷机构申请贷款的时候，信贷机构向第三方借用这个数据证明你自己，即使你已经授权了。

你也许会问，能不能更自由一点，由我决定这个数据使用在哪个场合？为什么只能在这个信贷机构而不是那个信贷机构？

至于那些有关消费行为的数据，也许我们根本不知道被采集了，更别说使用了，在网上，我们是不是自己，其实并不是我们说了算，比如你要提升自己的信用，你就得贡献自己更多的数据，这个逻辑是否有点怪？

那么有什么解决办法？

欧盟有自己的办法，发布了最严厉的通用数据保护法案GDPR，总体原则就是禁止企业在未经授权的情况下收集用户的数据，当然，它也要为此付出代价，虽然用户的隐私获得了一定的保护，但用户也将永远失去自己的部分数据，这个数据没法从其他地方复原。

其实用户反对的根本不是记录自己的数据，而是防止这个数据被滥用，GDPR这种严厉的封堵措施似乎有点因噎废食，难道为了避免车祸就得拒绝生产汽车？抹去自己在数字世界的记忆，不仅于世界，于自己也是一种损失吧，随着大数据，人工智能时代的到来，我们无法在互联网上做个透明人。

那么，我们能否从互联网巨头那里夺回自己数据的所有权呢？

web3.0就这么来了。

web3.0要解决的就是这个问题，要把用户自己的数据使用权，交还给用户，比如，有一天你不满意微信的服务了，想要换到其它社交媒体，你在微信上的所有数据都可以直接带走、迁移过去，你甚至可以不借助任何中间的公司，直接跟其他人在网上进行互动，这就是Web3.0。

哈佛大学的尼尔.弗格森教授打了这么一个比方，如果说Web2.0是建立起了网络世界里的数据高塔，那么Web3.0就是要让高塔变成广场，人们在广场上，可以自由自在地交流。

Web3.0的倡导者，很多都是早期的互联网先锋们，他们渴望让互联网回到最早那种自由、去中心化的状态，有点像《三体》小说里描写的，想让宇宙回到最初状态的“归零者”。

那么，如何才能实现Web3.0？

让用户自己掌握数据、随时带走，就需要借助分布式应用技术，英文叫Dapps（Data Acquisition and Processing Program）,分布式技术并不是一个新概念，上世界九十年代就出现了，比如电驴，但存储技术是需要成本的，因此只有互联网巨头才能负担得起。

分布式要解决去中心化，同时解决成本问题，大家自然想到了当前很火的区块链技术，区块链说白了，就是分散在所有个人用户设备里的数据库而已。

2009年，中本聪提出了区块链的概念，用虚拟货币当做帮助存储的奖励，奖励更多的人参与进来，可以说，是很天才地解决了分散存储数据的成本问题，区块链就是数据库，虚拟货币就是一种Dapps，但本质上来说，区块链只是实现Web3.0的其中一种解决方案，并不是唯一的，其它的解决方案还有data pods技术和星际文件系统IPFS。

但无论是区块链、data pods还是IPFS，研究这些技术的创业公司，都是在解决同一个问题，就是网络去中心化的问题，把Web2.0升级到Web3.0，只不过，在所有这些技术中，区块链的名气最大。

为什么区块链技术能实现“我的信息我做主”呢？

简单说一下区块链技术的逻辑：区块链技术采取分布式记账的方式，一笔交易信息，会让网内所有的节点，都进行记录；每一个交易记录，就是一个区块，每个节点把区块存储下来串在一起，就叫做“链”，这个流程都是由计算机程序实现的，也就是说，当我们使用区块链技术进行交易的时候，既没有中间商，也没有社交媒体收集交易数据去做精准推送，更没有信用机构跟踪这次活动。

明白了区块链的技术逻辑，你会发现，它之所以能解决目前互联网的垄断问题，是因为交易信息不是某一个数据库集中记录的，而是全网所有节点都有记录，对信息的所有权是没有独占性的，所以它实现了“去中心化”的目的。

其次，它解决了信息造假的问题，因为信息的真假，会被全网所有的节点验证。

最后，它解决了信任的问题，因为每个节点都有信息记录，你再也不需要去一个权威机构，开具类似“我是我自己”的证明，在网络里吼一声，所有节点都会回复你，只要大家的答案是一样的，你的身份自然就被证实了，区块链技术是有可能改变如今的互联网格局，打破大公司的垄断的状况的。

基于这些特性，未来区块链技术也许可以帮助我们拿回属于自己的身份数据，并决定它的使用方式，并且不再被别人操控和利用。

读到这里也许你还有很多疑惑，笔者就举个实际案例，当然这只是个理想的场景，能不能实现自当别说，但理是这个理：

你的个人所有信息存储在区块链中，意味着不可篡改，你拥有查看信息的唯一私钥和对外暴露一个公共访问地址，别人没法直接查看你的信息，如果一个互联网公司希望在你上网的时候给你投放广告，需要通过公开的地址申请查询你的个人信息，在获得你允许的条件下才能基于你的信息分析投放合适的广告，任何一次投放都是一次交易的过程，只不过这次交易将有你自己的参与，你既可以开放自己的数据以获得更好的个性化服务，也可以封闭自己的数据不受任何打扰，甚至可以用自己的数据与广告公司进行利益分成！

比如你要去贷款，不再需要通过第三方数据来证明你自己的信用，你只要授权开放查询区块链就可以了，不再有中间商赚差价了，再比如公益捐款，有了区块链保驾护航，那种中饱私囊，承诺无法兑现的事情估计就不会有了。

你的数据将真正的自己做主，这将是多么透明、开放、公平和自由的世界！

像任何新兴技术一样，Web 3.0 仍在不断完善，不久的将来，人们也许可以通过 DApps，实现和其他服务的交互，个人用户依旧可以使用网络浏览器访问互联网，在视觉呈现上，也一样对 Web 2.0 用户友好，以下是来自网上的一张示例图。

但颠覆Web2.0哪有那么容易，这不是简单的靠技术就能解决的，即使从技术的角度看，区块链也还有很多问题要去解决，比如目前区块链记账的速度有限，无法让用户大规模使用，而一般中心化的交易系统，每秒处理的速度上千都很正常，这是很大的短板，又比如现在存储信息获得奖励的行为是靠挖矿实现的，但挖矿这个事儿成本很大，一般人进不来。

但区块链技术把集中式数据库变成了分布式数据库，不仅去除了中间商，简化了信用的流程，而且还把信息的所有权交还给了个人，区块链技术的架构和逻辑，的确可以从根本上解决目前互联网存在的信任问题。

但区块链仅实现了数据的流通问题，并不能对数据本身进行复杂的加工，那在数据流通前，数据所有权、财产权、交易权等权益主体到底是谁，到底应该由谁来存储、处理加工你的数据以便让流通的数据有价值？

这不是技术能解决的问题。

淘宝诉安徽美景信息科技有限公司不正当竞争纠纷案的给予了我们一些启示，具体见笔者的另一篇文章《迄今为止最深入浅出的关于个人网络数据权利的解读，从淘宝胜诉全国首例大数据产品不正当竞争纠纷案说起！》：

“法院认为，涉案“生意参谋”数据产品中的数据内容虽然来源于原始用户信息数据，但淘宝将巨量枯燥的原始数据通过一定过得算法过滤，整合成适应市场需求的数据内容，形成大数据分析，并直观呈现给用户，能够给用户全新的感知体验，已成为网络大数据产品。”

“网络用户信息作为单一信息加以使用，通常情况下并不当然具有直接的经济价值，在无法律规定或合同特别约定的情况下，网络用户对于其提供于网络运营者的单个用户信息尚无独立的财产权或财产性权益而言。”

因此，即使你拥有原始数据，但为了让自己的数据有利用价值（起码有地方放存储吧），你总得委托某个代理公司采集、加工、分析你的数据，然后你的数据才会有交易的价值，但这个代理公司是谁？谁才具备这个能力？

显然现在的互联网公司成了加工你数据的事实上的代理，只是你们之间的代理关系现在是一张简单的用户使用协议而已，你处于绝对的弱势地位，只有在政府制定相关的政策法规后，才有可能要求代理通过技术手段来保证你拥有这些价值数据的相关权利。

比如当你要去银行贷款的时候，你有权利向代理公司索要自身的行为、身份相关数据来证实你的诚信，代理公司应该向你开放你数据的元数据，以便让你知道自己拥有哪些数据权益。

如果真到了那个时候，我们将在历史上首次拥有一个全国性的个人元数据库，这是全社会数据开放的前提条件。

结合区块链技术，它可以取代我们当前对互联网的观念，将网络世界拉回到一个去中心化的平等体制，当然这仅仅是个大胆的设想。

注：本文参考了网上关于web1.0、2.0、3.0的划分方法、区块链的相关介绍文章

完

作者：傅一平（微信号：fuyipingmnb）

可能错过的近期精选文章（点击链接即可阅读）

忙完工作，偷得浮生半日闲，讲述自己的数据人生

大叔/电信博士/500强央企/大数据/人工智能/统计取数/数据挖掘/数据产品/数据管理/数据仓库/数据变现

：，。视频小程序赞，轻点两下取消赞在看，轻点两下取消在看

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

我该如何从互联网“夺回”自己数据的所有权？

从芝麻信用分透露的详细数据设计，我们能从中得到什么启示？

艰难的旅程，你的数据中台到底能为一线提供多少火力？

PPT，考验你的格局、能力和思维的方式，你得学会驾驭它！

如何避免成为一台取数机器？

哪些广为人知的数据挖掘案例其实是一地鸡毛？

数据的价值到底如何评估？

为什么我提交的数据分析报告总是被领导K？

我如何用统计学指导自己的生活？

从吴军的“算法的油水就那么多”说起！

您可能也对以下帖子感兴趣

这样的洞庭湖决堤，实在让人同情不起来

李尚福、魏凤和双双被拿下，与美国一份报告是否有关？

抗洪靠嘴，堵漏靠沙？印度官员真是绝了！

有的人走了，却永远活着

圈内疯传某谣言

生成图片，分享到微信朋友圈

我该如何从互联网“夺回”自己数据的所有权？

您可能也对以下帖子感兴趣