查看原文
其他

谁用得好就归谁?谈谈大数据的所有权

傅一平 与数据同行 2021-10-16

点击上方蓝字关注公众号

请您点击“与数据同行”以“关注”,关于数据的实践与思考,每周一我在这里等你!

作者:傅一平 就职于浙江移动大数据中心  微信号:fuyipingmnb  欢迎交流!

这篇读书笔记来自于得到《薛兆丰的北大经济学课》的一点感想,在谈大数据归属权这个敏感话题之前,咱们先来听几个故事,因为没有来由的抛出任何一个数据所有权的观点会被喷。

一、三个案例

1、养鸡场和新居民

有一家养鸡场会发出恶臭,所以选址在偏远的郊区,哪知道随着城市发展,有开发商在这家养鸡场旁边修了居民区,居民就去告这家养鸡场,说养鸡场污染了环境,破坏了他们清洁的空气,如果你是法官,你会怎么判?

2、火车与亚麻

从前火车都是烧煤的,烧煤就会喷出火星,这种烧煤喷出火星的状况是改不了的,所有火车都有这个特性。

这时候,一辆火车经过一块农地,这块农地的农夫种的是亚麻,他们把700吨亚麻堆在了铁路边上,这亚麻是农夫的,铁路边的农地也是农夫的,亚麻放在这农地上,没有碍任何人的事儿,但是火车经过的时候,它喷出的火星,把那700吨亚麻给烧了。

火车公司把人家的700吨亚麻给烧了,你觉得火车公司要不要赔偿?你肯定说应该赔。

3、kindle笔记与用户

北大经济学教授薛兆丰注意到自己在亚马逊Kindle上“读书标记”的处置权问题,薛兆丰边阅读书籍,边会利用电纸书Highline划重点。这些重点既保存在电纸书上,又会上传到亚马逊云端。薛兆丰发现,这些笔记数据归属于亚马逊。

“书是我买的,下划线也是我亲手划的,但为什么会归亚马逊呢?”——这听起来相当具有争议性,但这个结果是从薛兆丰首次使用Kindle时,点击用户使用合约中的“同意”按键开始的。那个合约文件用最小字符8号字打印出来,也有好几十页,很多人不会看,就会直接选择“同意”。

但很多用户肯定不服气,说这种所谓的同意是小人的伎俩,亚马逊还是侵犯了我的数据隐私,要亚马逊赔偿,但亚马逊肯定也不服气。

养鸡场污染了居民空气,火车烧了亚麻,亚马逊侵吞了用户数据,这三个问题从情理上看似乎都是前者犯规需要赔偿,但从经济学角度看并不是这样,经济学家科斯最早提出了质疑。

二、从经济学角度看问题

有一句希腊文格言很有名:“行使你的权利,但应该以不伤害别人的权利为界”。喜欢这句话的人很多,但能不能作为判断谁是谁非的指导思想呢?事实上所有的伤害都是相互的,养鸡场可以说自己搬到郊区就是为了有污染权,火车可以说农夫在路边放亚麻触发了危害,亚马逊可以说提供了用户便捷的记笔记功能。

火车案例法官判决是这样:“虽然我们都认为铁路应该赔偿农夫,但是我们设想一下,如果铁路跟农夫的总收入中产出达不到最大值的话,那么农夫可能要负一定的责任的。”在现实生活中,如果铁路和农地都归一个人所有的话,他当然会说,“我能不能把堆放亚麻的地点稍微挪远那么一点点,意外就能够避免了。”

这个想法很重要,正是基于这个想法,科斯的意思是说,铁路烧着了亚麻,但是责任可能在农夫,因为农夫避免意外所要付出的成本,比铁路避免意外所要付出的成本低的多,谁付出的成本更低,谁就应该担当更大的责任。如果这样分摊责任的的话,整个社会为了避免意外所要付出的总成本就会达到最小。

三、谁用得好就归谁

科斯进一步说,我们不应该把问题看作一方伤害另外一方,而应该把问题看作是双方都在争用稀缺的资源,谁用得好就应该归谁,比如Kindle的用户笔记数据,显然归属亚马逊更合理,亚马逊掌握这些笔记数据的所有权具有其合理性和某种程度的必然性,因为相较于单个读者,亚马逊掌握了笔记数据后,能够把它们用起来,为大众提供更经济有效的服务,比如亚马逊会把从数以万计读者那里统计来的某本书的笔记数据汇总回推给读者,所谓取之于用户回馈于用户,但即使是这个道理,很多人情感上还是不能接受。

再举个淘宝的例子,有许多顾客在淘宝逛店,逛店就会留下电子痕迹,这数据归谁?你可以说数据归顾客,也可以说归电商所有,淘宝平台也可以说归自己所有,因为这些数据是淘宝的平台上产生的,存在其平台上,所以这些数据应该归其所有,公说公有理,婆说婆有理,你觉得这些数据应该归谁?

谁能够把这些数据用好呢?逛店的顾客用不上这些数据,电商也不太可能用得好,淘宝平台用好这些数据的可能性更大,你看,用于淘宝商品网页设计可以方便顾客购物,用于生成芝麻信用分可以方便大众生活,成立蚂蚁金服可以为客户提供便捷的贷款,这也算是为社会提供了更大的贡献。

如果从这个角度讲,我们应该鼓励各个企业采取正当的途径充分利用用户的个人数据去为社会创造效益,而不要一提到某企业使用用户数据创造价值就觉得侵犯隐私,如果我们能够做制度设计的话,就应该把制度设计成,尽量方便能够更好运用数据的人得到这些数据,尽量减少当中的阻力,这样这些数据就能产生更大的效益。

四、暴露隐私让社会诚信

好多人对于隐私权非常敏感,觉得隐私权一点都不能出让,当然笔者能够理解这种感受。我今天跟谁在一起,跟谁吃烛光晚餐了?这些数据对别人可有可无,但对我来说可能非常重要,所以保护隐私确实重要,但是我们要明白,有些数据对大众来说也是挺重要的。

隐私暴露的一个重大好处,就是人变得可信,大数据可以根据一个人的各种状态,尤其是他工作、交友、收入、指出等信息,判断一个人的信用。

而更重要的是,当一个人知道自己的信息被采集,自己的行动受到某种监测,自己的信用受到评估以后,他也会积极性矫正自己的行为,这时候一个人的信用程度不仅会被彰显出来,而且会得到进一步的有意识的提高,比如笔者自从用了信用卡就会养成按时还款的行为,以前真没太关注这个,觉得不差那几天,但如果所有人都不差那几天,问题就严重了。

我们简单的对中美和欧洲的电子商务发展做一个比较,就能够清楚的看到这个趋势,欧洲对于个人隐私信息使用有严格的限制,而中美规定则比较合理、比较宽松,欧洲的电子商务发展就很慢,而中美的则很快。

因此,起码到目前为止并没有完美的解决方案,我们生活方便了,人与人更信任了,意味着需要牺牲自己部分的隐私权益。

五、政府监管的挑战

假如你暂且同意前面说的,也许就会说,既然你说谁用的好就归谁,为了防止滥用,就交给政府吧?我只信任政府。

但政府可能缺技术。

然后你会说,为了既有诚信,又有技术,可以让政府出面,挑选有技术的大公司,这样就两全其美了,但问题可没这么简单。

阿里一直在跟政府合作,希望获取各方面数据来做城市大脑,但问题还是很多,其中一个原因就是大数据的管理问题,为什么?

主要还是交易成本。

经济学家张五常曾经给交易费用下过一个非常广泛的定义:凡是在一个人的社会里不存在,而在多个人的社会里存在的成本,就叫交易费用。

各方数据的汇聚哪有这么简单,我们前面假设了铁路跟种亚麻的农夫是同一人所有,就是在做计算衡量的时候,几乎不需要成本,只需要一个人脑袋里面打架就可以了,只需要自己说服自己就可以了,但现实生活中不是这样的。

城市大脑当前还仅仅是为了解决局部的交通问题,你看政府就要花很大的代价去说服各方达成数据信任,要协调多方制定非常复杂的数据共享规范,制定可行的数据安全监控体系,各方则要花很大的代价去理解对方的数据、统一数据的格式、进行数据的整合和维护等等。

又比如现在全社会都希望能打造强大的反通信欺诈网络,但为什么政府不能撮合BAT、银行、运营商等的数据进行协作来更加有效的打击欺诈,原因就是交易成本太高了。

六、大数据应该率先由大公司使用

虽然鼓励企业利用数据创造效益,但现阶段数据免费共享却不现实,虽然数据给一个人使用不影响别人使用,但实际上,原始的数据是没有价值的,至少很难使用,数据必须经过采集、清洗、转化、整合、建模技评估等阶段,它们的使用价值才逐渐增加,而这些工作都是要付出实质成本的,只要是这样它们就不会是免费的。

诺贝尔经济学奖得主梯诺尔就认为数据应该按照加工付出的成本确定最终的归属权,比如用户浏览一个网页的行为数据可能归属用户,但用户上网偏好就应该归属加工者。

薛兆丰教授给出了自己的观点:数据一旦借出去就不存在还回来的可能了,正是因为这样,在分享数据的时候要更谨慎,比较好的做法是,是先由大公司和大公司之间分享数据,因为大公司担负的社会责任比较大,保护个人隐私信息的技术和规范都比较先进,出了问题追究起来也比较容易。

从这个角度来讲,大型国企倒真的应该多进行大数据共享和价值创造工作,因为一方面有足够的资源进行数据价值的开采,另一方面承担的社会责任比较重大。

无论如何,根据科斯定理的预见,关于隐私权的争论,最后解决的方案不会一边倒,既不会允许肆无忌惮的侵犯个人隐私权,个人也不可能绝对地保有所有的隐私权,最后一定会在两者当中取得一个平衡,而当中的一个指导原则,还是科斯定律:谁用得更好就归谁,先期能用得好的最有可能的是有责任的大企业,当然这个好是必须对于社会有正向的贡献的,监管的重任则需要依赖政府。

视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存