巨头的数据垄断,正在让互联网平台“垃圾化”
2024-10-28 08:16

巨头的数据垄断,正在让互联网平台“垃圾化”

被数据驱动的社会给人们带来便利,但也显露出了相当多的隐忧。在一个“黑箱社会”,除了数据被大量收集、隐私被侵犯,数据化的抽象以及对一切的赋值也导致了对社会现实的扭曲和偏见。本期将介绍一本来自学界、关于数据化社会的最新著作,采用更加偏向政治经济学的角度来剖析当下的技术巨头如何改变着生产和交易机制。


本文来自微信公众号:信睿周报 (ID:TheThinker_CITIC),作者:李子(哥伦比亚大学医学院医学人文系),原文标题:《李子丨数据社会的新游戏规则——谈〈数据飞地〉 #STS:物造人专栏02》,题图来自:AI生成

文章摘要
互联网巨头的数据垄断导致平台“垃圾化”和社会扭曲。

• 🔍 解析“数据飞地”概念,揭示科技巨头数据垄断。

• 💡 讨论“寄生创新”,科技巨头如何侵占市场。

• ⚠️ 探讨“垃圾化”,平台体验下降,用户无处可逃。

数据化的社会,对我们到底意味着什么?很多时候,打开浏览器的那一瞬间,刚刚搜过的商品、访问过的网站或者在社交媒体上粘贴过的内容,都会一览无余地出现在边栏。有时候,我们不禁怀疑:手机是否在全天候地监听我们?到底有多少数据被技术巨头所掌握?


Data Enclaves, Kean Birch

Palgrave Macmillan 2023


这背后是大量的、无孔不入的数据收集,精确的数据挖掘,以及建立在巨量数据基础上的人工智能的飞速发展。所谓“大数据”,是一种量变引起质变的积累,因此当下的技术战争也成了数据的战争。技术的发展依赖着更多种类、更高质量的数据,除了用于训练大模型的文字和图片,还有各种传感器和终端所生产的数据——每个人在互联网上的浏览数据、地理定位数据、医疗健康数据等。各式各样的个人数据是当下数字经济的关键,甚至是最重要的资源。


Machine Learners, Adrian Mackenzie

The MIT Press2017


但从政治经济学和STS的角度来看,量变引起的质变并不仅仅体现在技术的“内部”,即模型的训练上。当下的STS学者继承这个学科分支将技术与社会作为一个综合整体来分析的传统,对与数据的生产和搜集相关的社会关系进行了更深、更广的挖掘。


从纵向来看,阿德里·麦肯齐(Adrian MacKenzie)[1]和弗罗里安·嘉顿(Florian Jaton)[2]等学者从人类学的角度审视数据和算法模型的生产链条,解析了“向量化”(vectorization)等各种技术原理对于下游技术和应用发展的影响。而从横向出发,另一部分学者结合了技术分析的政治经济学,为我们提供了一个从更全面的角度理解数据化社会的图景。数据的收集和流通、数据的归属,乃至数据的呈现,整个体系的游戏规则都在经历着十分剧烈的变化。


The Constitution of Algorithms

Florian Jaton, The MIT Press 2021


加拿大政治经济学家基恩·贝奇(Kean Birch)2023年出版的著作Data Enclaves(《数据飞地》)就将目光放在了那些掌握数据的巨头身上。他认为,在过去20年互联网飞速发展的过程中,大型科技公司集中了大量的数据资源,且这些资源被它们所占据,很大程度上不受市场或者监管规则的影响,阻碍了流通和交换。这些数据和科技巨头的政治经济资源一起,形成了所谓的“数据飞地”。


“数据飞地”是什么?


“飞地”一开始是指一块位于某政权管辖范围内但又不受其控制的土地,例如被意大利包围的小国圣马力诺。这个概念也被引申到其他社会和地理概念上,用于描写一个自成一体的人群或者聚落。贝奇使用“数据飞地”这一概念去描述科技巨头自成一体的数据生态:这些公司收集大量数据,但过程极其不透明,其他人或组织无法获取,更无从检查、监管。这种封闭但体量巨大的数据系统不仅是科技巨头最重要的财产,也是其垄断并且主导市场和资本动作的关键。


Seeing like a State, James C.Scott

Yale University Press 2020


贝奇在书中从数据本身开始,介绍了数据如何被科技巨头圈作飞地的过程。在第二章,他详细地介绍了个人数据领域,并借用了人类学家詹姆斯·斯科特(James C.Scott)的statecraft概念(即政权为了管理对社会进行的抽象和计算)[3],将其扩展为techcraft,即如何像一个科技公司一样去看待个人数据。


如果不对数据做出诠释,那么数据就只是一些无用的、散布的数字信号。而这个过程,就是所谓“挖掘”数据产生对于这些商业公司的潜在价值的过程,也是对每个人的生活进行“可视化”、测量和估值的过程。这个过程包括建立技术标准、测量手段和指标以及商业逻辑等,均指向盈利。


在接下来的一章中,贝奇解释了为何这种盈利不是一个市场导向的过程。因为海量的个人数据并不具有交换价值,它们不是商品,而是资产——一个人住在哪里、买了多少东西,这些都只是事实信息,并不是具有知识产权的内容;真正产生价值的是这些信息和科技公司的技术手段之间的互动,是这些互动促成了用户的点击、注意力资源的消耗、购买行为等。


用户数据作为资产,也包括了科技公司对数据所拥有的合法权利、知识主张、管理实践、合同等,这一整套技术经济配置(configuration)塑造了这些科技公司对数据的强大控制,并通过各种估值手段产生了实际的价值(第四章)


第五章聚焦贝奇的重要论点:数据飞地的形成。有了数据还不够,科技公司的运作模式是将这些数据都圈进自己的领域,制造所谓的数据生态,包括技术设备、平台、用户、开发人员和支付系统,以及附带的法律合同、责权和标准等。这一切都是为了帮助科技巨头吸引其他企业、用户、消费者、开发人员等,依靠这个生态系统生存,并不断巩固其市场主导地位。这个生态系统制造了相当多或明或暗的壁垒,每个参与者在享受便利的同时都受其束缚。


贝奇用谷歌公司旗下的DoubleClick广告系统作为本书中为数不多的案例之一,分析了这个系统如何让你一打开浏览器就能看到各种“个性化”的广告——它掌握了大量的用户信息,并且能通过浏览器插件“认出”用户,触发自动竞价,将价高者显示在用户的浏览器中。广告投放商只能通过DoubleClick触及用户,而且这个系统还在不断地通过对个人信息的掌握吞并上下游,主导网站广告浏览生态。


“寄生创新”及其后果


毫无疑问,贝奇对于科技巨头所制造的数据飞地持批判态度。他使用了“寄生创新”(parasitic innovation)这个概念来定义用数据飞地去主导市场、避免竞争、削弱竞争对手的战略企图。结合传统的政治经济学理论,他认为这种寄生创新亦是一种“寻租”(rent seeking)行为,即用非生产性的方式来增加自己的财富,而不是通过创造新的价值或财富来获取经济利益。


诚然,这些数据收集技术都是技术创新,但其创造的壁垒以及在此之上诞生的生态系统都并非一种自由、透明的市场交换,而是想方设法榨取超额利润的行为。传统意义上的寻租通过游说政府、制定保护政策等方式进行,而贝奇认为,科技巨头之所以能够为所欲为,是因为通过数据生态系统所呈现出来的这种垄断事实上也阻碍了市场的交换,在此,市场规则不再适用,被由科技巨头制定的规则和技术标准所取代。


这种寄生创新与平台经济诞生初期的初始模式有关:风险投资方支持的初创企业用技术手段去制造或者撬动一个新的需求,去探索所谓的“红海”,去抢占用户、开发者和供应链,目标都是独占某个市场需求,整合生态上下游,最后仿佛“寄生”在这些资源上一般,达到控制的目的。


在这个过程中,科技公司得以榨取新的资源价值,实现营收,并且将成本转嫁(比如,用所谓创新的手段去规避监管,平台劳工即为一例)。其控制的能力来自对于信息和数据的单方面、不透明的控制,原有的市场受到侵蚀,并被科技巨头自己制定规则的生态系统所取代,而这些科技巨头对自己的模型和数据来源无不讳莫如深;同时,数据监管的空白也给了这些科技公司以可乘之机。


那么,寄生创新的后果是什么?除了传统的垄断效应带来的成本上升、用户利益受损等后果,贝奇亦谈到侵占和圈拢数据的过程是一个反身的过程。


数据和相应的数据收集技术会和用户互动,数据塑造着每个人的用户身份,用户也因此会被这个系统所影响:个体或者说消费者不再是市场思维的中心,信息成了最主要的元素,经过技术的构建和包装的信息引导、激励人们,使之按照这些数据所圈定的方式产生行动;这些行动变成数据,反过来又巩固了数据系统本身,人们亦会受信息影响,改变自己的行为去和系统进行对抗,那么系统收集到的数据就不再能够反映人们的需求了。


另一个后果被贝奇称为“垃圾化”(enshittification),这是一个当下比较流行的概念,援引自技术批评家科里·多克特罗(Cory Doctorow):平台聚集免费用户,收割他们的数据;同时,平台为了吸引广告商,降低用户体验(比如推送广告),并向广告主收取大量费用(用数据飞地实际地“占有”了这些用户),此时用户被困在平台上无处可去,除非下一个平台重复此类过程。


用户体验的降低和用户流失让平台上的各方不得不去投机取巧,假造数据,吹嘘价值,从而导致数据的价值进一步坍塌,平台的可用性进一步降低。


贝奇认为,这些过程最终将扰乱市场,且没有为用户带来实质性的好处,唯一的结果是让平台的权力和影响力过度膨胀。他认为,数据飞地的一大悖论就是,数据的社会价值唯有在开放、共享的环境中才能得以施展(例如“开放科学”等尝试),但对科技巨头来说,唯有将数据圈为“飞地”才能更好地为他们带来利润。


因此,数据为谁所有,为谁所用,通过怎样的机制发挥作用,将会是下一个阶段各方“争斗”的焦点。对于个人数据,应该要有更加创新的管理方式,以便重新定义数据归属和使用的模式;除了保护隐私等比较迫切的需求,也应该充分考虑数据和数据收集的社会影响。


“数据殖民”:数据到底是资产还是基础设施?


对于科技公司的大肆扩张以及数据化、平台化趋势,当下STS学界也有相当多的探讨,其中亦不乏肖珊娜·祖博夫(Shoshana Zuboff)的The Age of Surveillance Capitalism(《监视资本主义时代》)[4]这种“出圈”的作品。


不过,从政治经济学角度切入,用一个审视国家、市场和企业的视角来审视数据和技术,的确启发了人们从一个更基础、更宏观的角度去理解平台。监视行为本身固然重要,但“监视”——数据的收集和处理——仅仅是对科技巨头的行为的一种诠释。在巨量数据驱使下的逐利和割据决定了技术公司的经济和技术设计逻辑,“监视”或许只是其带来的一个后果。


The Age of Surveillance Capitalism

Shoshana Zuboff, PublicAffairs 2019


和数据飞地有异曲同工之妙的提法是“数据殖民”(data colonialism)[5]。伦敦政治经济学院的尼克·库尔德利(Nick Couldry)和乌利塞斯·梅加斯(Ulises A.Mejias)使用殖民主义的框架来探讨当下的数据收集现象。历史上,宗主国通过掠夺殖民地资源,形成了工业资本主义的原始积累,而当下对于数据的掠夺与此类似:我们生活和关系的方方面面都被数据的收割所“抢占”,不过将新大陆转换为资源与市场罢了。


而数据殖民的关键在于这种关系是非常不平等的,我们和技术巨头是被掠夺者、被殖民者和掠夺者、统治者的关系。我们对技术手段形成依赖,无法抵御这种剥削关系的存在。数据殖民和数据飞地不同的一点,在于其对意识形态的制造——个人化、数据化、连接等成了当下世界的重要价值,但这些价值的流行与技术巨头的粉饰分不开。


虽然贝奇在书中也有探讨“数据的价值”,并且说明了它的社会价值并不等同于其资产价值等,但对于这种价值和当下新自由主义社会的价值取向的关系,贝奇并未予以阐明。


The Costs of Connection

Nick Couldry, Ulises A.Mejias

Stanford University Press2019


另外一个剖析的角度是技术手段的社会机理。相当多的STS学者都将当下的技术平台纳入基础设施的层面予以思考,因为基础设施使人们进行社会经济、交易活动变得可能,也深刻地影响着各方的行为模式。然而,基础设施是如何建立的,这其中有着怎样的社会角力,最后将落实成为怎样的形态,《数据飞地》并未做详细的梳理。


STS学界对于“实践”的考证和分析,即什么构成了数据实践,需要借由更偏实证的研究去探讨。一些历史著作或许能给我们提供参考——比如,美国保险业起初是怎么用数据去构建风险的[6],各种金融机构以及金融职业对有限数据的收集和提取,以及各种推测和计算中掺杂着政治和文化带来的偏见与阴差阳错的决策。放到今天的数据社会,类似的摸索和角力必然会以另外一种形态产生,最后亦会影响技术的形态。政治经济学与技术人类学的结合,或许会给我们提供更多新的洞见。


参考文献

[1]MACKENZIE A.Machine Learners:Archaeology of a Data Practice[M].Cambridge:The MIT Press,2017.

[2]JATON F.The Constitution of Algorithms:Ground-Truthing,Programming,Formulating[M].Cambridge:The MIT Press,2020.

[3]SCOTT C J.Seeing Like a State:How Certain Schemes to Improve the Human Condition Have Failed[M].New Haven;London:Yale University Press,2020.

[4]ZUBOFF S.The Age of Surveillance Capitalism:The Fight for a Human Future at the New Frontier of Power[M]//Social Theory Re-wired.London:Routledge,2023:203-213.

[5]COULDRY N,MEJIAS U A.The Costs of Connection:How Data are Colonizing Human Life and Appropriating it for Capitalism[M].Redwood City:Stanford University Press,2020.

[6]BOUK D.How Our Days Became Numbered:Risk and the Rise of the Statistical Individual[M].Chicago:University of Chicago Press,2019.


本文来自微信公众号:信睿周报 (ID:TheThinker_CITIC),作者:李子(哥伦比亚大学医学院医学人文系),原载于《信睿周报》第130期,原题为《数据社会的新游戏规则——谈基恩·贝奇的〈数据飞地〉》

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP