【新经济】为大数据建立产权制度|盛洪

为大数据建立产权制度

——在《新经济系列沙龙第七期——“谁的大数据?”研讨会》上的发言
盛 洪

致辞

我们这次“新经济沙龙”的主题是“谁的大数据”。背景是,在新经济发展过程中,尤其像交易平台或社交平台在互联网上各种各样的操作行为会形成一种资源,这个资源叫大数据。这个资源有它的独特性,第一它是全社会互动形成的一种资源,它又是人为的资源,又不是人有目的行为的资源。这是非常有意思的事情。这个大数据来势迅猛,很多互联网公司,很多原来的计算机公司为了改进产品和服务搜集大数据,这个大数据越来越多。大家知道它代表了人的某种行为的全面信息的反映,但是不知道怎么对待它。现在我们知道大数据是一种资源,跟原来的资源又不一样,跟煤和石油不一样,它们代表了能量。这种大数据的资源跟自然资源的区别第一是人的行为形成的资源;第二这种资源包含了大量的信息,这种信息资源跟包含能源的资源有一些区别,它是能够改进资源配置的资源。最重要的一点在于,人类对待任何资源最重要的目的是要最有效地使用这种资源。

根据制度经济学的一贯思路,这个思路数千年到现在为止亘古不变,就是首先要解决资源的产权问题。这个资源不管是公共资源还是人为的资源,或者通过买卖成为私人占有的资源,我们首先要说是“谁的大数据”,我们的大数据的产权特性是什么?如果这个产权形式有问题,按照产权理论的看法,可能不能使资源最佳配置。但这个问题不是三言两句能说清楚的。

大数据资源虽然是公共资源,是人们互动造成的资源,但是在技术上被大的平台公司掌控,这是很明显的。我们知道任何一个名义上的产权,它在实际的运作和交易当中,它和谁掌控它密切相关。实际上由平台公司掌控。我们广大的消费者就说“我们创造了这个资源,没有我们的买卖行为和搜索行为以及交易和聊天行为不会产生这个大数据资源”。很显然这是大家共同创造的,不能说是你这个公司的,我们创造的时候把这种资源留在了公司后台的服务器上。这时候就要仔细的考虑,你说它是公共资源,你说平台公司应该无偿拿出来,这个在操作上有很多的问题。还有这个资源包含很多的信息,比如平台公司说:我们为什么不能开放这个资源?这里面有我们的商业秘密;个人也说了,这里有我的个人隐私,这里涉及到非常复杂的利益,不是用一句话或者一个概念去套的。天则所和互联网实验室的定位是中立的研究机构,我们做这件事情不会跟任何大公司合作,或者跟政府合作,而是民间中立的机构,我们请来的学者也是严肃中立的学者,都持有一种中立的态度。

我们这一期的题目非常好,我们一定要坚守这一点,无论是天则所还是互联网实验室还是各位学者一定要对这件事情做一个中立的讨论,认真的学术的负责任的讨论,我们会为中国的发展甚至为全世界互联网的发展做出贡献。我们原来总是跟着美国,因为美国早就有结论了,现在美国好像也没有什么特别成熟的结论,我们这个讨论就是显得更为前沿的探索了。所以这一期的题目非常的重要。

主题发言

首先大数据作为一种资源的性质是什么样的?它有比较复杂的性质。从它的生成来讲是各方互动的结果,否则就没有这样的一个大数据。还有一点,从它的形成机理来讲,如果没有平台公司强大的服务器群和计算能力、存储能力它也不存在,你说煤是自然界生成的,但是它经过了物理过程,这个物理过程也很重要。还有两点特殊性,一个是商业秘密的问题,它是人为信息,但是又涉及到平台公司包括卖家和买家的商业秘密,如果完全无偿的向公众开放的话可能也有一些问题,涉及到某些主体的利益。还有一点就是个人隐私的问题,个人隐私是可以交易的概念,一个是它确实是存在的,第二它的边界可能是不一样的,你愿意出多少的代价买我的个人隐私,就变成这个问题。我们都有这样的体会,比如要获得某种服务时,需要把电话号码、身份证号都要扫描上传一下,你要考虑要不要交换。涉及到个人隐私再被出售,这是一个问题,你提供这个网站它再卖数据肯定是问题,一定是当下的个人隐私跟你的交易的关系,再出售的话会给个人隐私带来干扰,增加成本等问题。

除了这些,大数据还是有某些公共性。一方面它是公共产生的,另外一方面假如说它不是公共的话,它的使用会受到限制,不能造福于社会,这也是非常重要的一件事情。确实要考虑把大数据谨慎的做某些扣除以后将它视为公共资源。我们近期的研究涉及大数据,作为经济学家特别喜欢这个东西。经济学家过去的研究都是市场中有供给和需求曲线,交点是均衡价格和均衡产量,我们其实没有这个市场过程的任何数据,但是现在由于有了互联网有了电子商务交易平台,这个东西是有的,每一笔交易都有,能记录整个的交易过程,能记录整个价格的收敛过程,这对研究是非常重要的。假如说我们能非常方便的拿到大数据,我觉得经济学确实要革命了,经济学课本就要重写,因为很多东西过去是猜的,但是猜的一定有我们不知道的错误。我们往往看这个假设是对的,但是在现实面前会被击得粉碎,经济学理论一定会前进的。这完全是公共的利益,而且是基础的理论。当下看这个社会可能没有什么,但是长远来讲一定是有意义的。像量子力学好像没有用,真正用的时候它能造原子弹。原来是极为抽象的理论,但是后来它可以造原子弹了,这就影响了二战。

还有这些大数据能提供很多社会需要的信息。我们有这么多的大数据,可以形成一整套从大数据中获得的经济指标,比如说电子商务的价格指数,电子商务的产品结构,市场结构,企业的规模等等,能形成很多公共的经济指标,这种经济指标对我们更准确描述经济的运转有帮助,会更真切,甚至比统计局的一些数据还要好,因为那些数据是抽样的。甚至最终它可能替代整个统计。假如说没有人真正造假的话,一定比我们现在能获得的经济数据更真实,对整个社会经济的了解和研究可能更有意义。

还有就是,大数据如果不开放的话,可能带来一些信息不对称,或者信息掌握的不对等,这会有很多的问题,尤其平台公司是面对两边的,一边是卖家一边是买家,信息优势可以带来谈判优势,带来交易的不公平,短期看对掌握大数据的一方有好处,长期来讲这是没有好处的,对整个社会是有问题的。从经济上来讲,我们必须有关于大数据的定位,还有对大数据的产权的界定,它的操作程式以及最后的进一步的使用。到底具体是什么样的形式?我想假如说它是公共资源,也未必一定是所谓的完全强制性的开放的形式,这里还有很多的扣除。即使是公共资源也有很多是有偿使用的,比如说煤和石油也是公共资源,但是在任何国家,这个资源归国家没有问题,但是它可以拍卖开采权。

网络中的大数据,大概也是这样的一种情况,这跟石油、煤炭不太一样,可能有这样一种情况,但是形式上不太好说。比如说我们爬数据,这件事情也不是免费的,因为爬数据需要成本的,而且有时候爬数据也不是很好爬,还有反爬。至少有一点,你应该让大家付出一点成本怎么获得,这本身就是花时间的,这本身就是在付款。是否可以有这样的规定,平台公司不能反爬虫。但是这跟保护商业秘密和隐私就要有协调。还有一种可以是有偿的,比如说我希望有偿的获得阿里后台或者腾讯后台的数据,只要我认为它比我用爬虫软件爬便宜,这也可以,这应该也是比较简单的方式。现在交易很简单,是否数据交易也可以简单化一点,但是你多少应该有一点成本,可能更好。

再有一点就是即使它有什么成本,也不要太高,一方面要给收集和储存这些数据的公司一定的成本补偿,另外一方面这些数据作为资源增长速度远远快于使用速度,从使用角度来讲如果太贵的话是跟不上的。最后还要鼓励使用这一方,我们本来能从中获得更多的价值,但是现在没有获得那么多的价值,这个社会最终要鼓励使用者,最终的产权其实是使用方。我们研究了很长时间土地制度,最后发现一个问题,最终从土地中获得最大利益的不是地主而是佃农,因为他是使用方,是直接收获土地中的粮食的,其他的各方相对于佃农来讲都相对处于弱势,对一个东西实际拥有产权的,或者拥有最大部分产权的,是使用方,这对社会是有好处的。我的想法就是这个社会应该给大数据的使用方一个相当的界定和便利,使得社会充分的从使用、分析大数据中获益。

讨论部分

吴绪亮:请问盛洪老师,大数据是否是公共资源?你说的公共资源是公共品还是什么?怎么界定它?第二你说要鼓励大数据的使用权,怎么去鼓励使用权,是在所有权不让路的情况鼓励使用权?

盛洪:说是公共资源,主要是讲它的生成。它的生成是社会所有人都做了贡献,这是人为的,跟煤和石油不一样。大多数国家都将它们定位于公共资源,它们的初始产权是公共资源的概念,它跟公共物品不一样,公共物品是人为投资和提供的。大数据确实比较独特,它是人为的,又是人的非目的的行动自由形成的,整个大数据,每个人都做了贡献。公共资源可以通过合约的方式转变为私人产权,就跟煤和石油是一样的,国家可以拍卖它们的开采权,卖完后就是私人的。很多国家都是这样。这使它们能更有效的使用。你说归平台公司,消费者肯定不干,你说归消费者,平台公司和卖家也不干,这是它的初始状态。我们并不是要像人民公社一样去使用免费资源,所有公共资源比较有效的使用方式还是通过一个合约转化为私人拥有,就是排他产权比较合适。假如说公共资源大家随便用这可能不行。

使用资源上,我刚才举的是佃农的例子。人类不要对实际中的产权制度有一种教科书式的理解,比如这个土地是地主的,佃农租他的地,这个概念没有错,但是你要看人类一、两千年的制度实践,真正在这个地上一辈子或者几辈子的永佃农逐渐会获得越来越多的产权。例如一块地是固定地租,每亩假设100文,这会导致一种结果,永佃农会对土地投入更多,例如改变地力,兴修水利等,因为更多的收获全是他自己的。原来产量是500文,改进技术以后可能1000文、2000文,实际上地主拿的地租率是下降的。由于粮食是永佃农生产出来的,要不给地主,地主拿不到,地主跟永佃农分地租的时候处于劣势,在实际当中是这样的。像英国的土地是典型的例子,它是国王的土地,到现在英国土地名义上也是国王的土地,它只有征税权,它真正的地主是实际保有使用权的人,这是对产权制度历史考察的理解,我们不能太教科书式的理解产权,真正的使用者有更多的实际产权内容,这种结构可能是最好的。

总结

讨论“谁的大数据”这个题目非常重要,我们有非常多精彩的讨论,而且角度不同,观点互补,形成了相对完整的讨论,非常的精彩。大数据是一种公共资源,公共资源可以作为生产资料。我的想法就是说,实际上这种资源有很多特性,跟以往的传统资源不一样。第一它不可耗竭,石油和煤是典型的不可再生可耗竭的东西;第二它在不断的增长,增长速度非常快;还有一点是用完了还有,我们即使有一种大数据产权,也不会有可耗竭资源那样非常高的产权费用。我也不太赞成因为它是公共资源由政府来管这件事情,很多公共资源可以由某种联盟来管。比如说美国联储不是美国政府,而是银行的联盟,将来可以有更多的平台有一个联盟,这是最好的设计,然后它的价格很低,成本很低,但是它实际上会给平台带来一定的收益,至少能补偿它的成本。假如说你要我一年一百块钱,我就可以实时到阿里后台看数据,我这种人会非常多,社会会从此受益。还有平台之间,所谓的商业利益并不是一般的老百姓感兴趣的,而是竞争者之间的,如果我们有共同公开的规定,谁也不吃亏。比如说阿里和京东。当初就是因为京东怕阿里会知道它的商业秘密,所以就自行开发支付手段。其实商业秘密可以互相共享,可以有更少的障碍。

还有一点,涉及到平台问题,又涉及到平台规模和垄断问题。我一贯主张,反对垄断最好的办法是鼓励竞争。下一步最棒的事情就是鼓励平台间的互联互通和平台间的变换,更便利使用者在平台当中变换。只要是没有人反对,甚至有鼓励的话,会有这样的一种共享的变换,我记得原来的微博就是这样的,新浪的、搜狐的、网易的,好多微博,后来有人开发一个软件,你只要这里一发,四个微博平台都会发出来,这个很好,但是它后来被干掉了。有一个非常快的平台间变换的话就鼓励了平台间的竞争,导致的结果就是平台会多。平台多也许是一个好事,我觉得这是可以构想的事情,我们将来可以共同去想,甚至可能是一个商业机会。

再有一点是政府的作用,这一点特别的重要。方兴东讲到这一点,实际上平台有可能借助于政府资源。我们刚才讲鼓励竞争政策。还有一种情况是平台不愿意竞争,它有政府资源,要借助于政府资源,强化平台垄断和抬高进入门槛,这个前景要警惕的,这对我们很不利。更极端如踪家峰说的,有一个超级超级的平台就是政府怎么办呢?至少在我们的逻辑里,在我们的规范想法里这要受到约束的,这是毫无疑问的。我们必须要朝这个方向努力,这个努力相对比较困难,但是努力比不努力好。我还是挺支持方兴东的立场,警惕超级平台的立场。同时天则所也是在关注这个问题,去思考去想,从经济学、从法学角度去想,首先是怎么看待这个问题,然后是怎么解决这个问题。从这些角度有一个大致的有关大数据的讨论的框架,可能还需要更多的讨论,还有更多的工作等着我们去做,我们要进一步的努力!我就总结到这里。谢谢大家!

                                        2017年12月8日

作者: flourish378

经济学家,儒家。

发表评论

了解 盛洪教授 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading