查看原文
其他

数据基础设施:作为纵深维度的隐蔽可供性研究

马中红 胡良益 国际新闻界 2023-03-28

本刊官方网站:

http://cjjc.ruc.edu.cn/


摘要

互联网平台正在深刻影响人们的日常生活和现代社会发展。平台提供的软件服务,满足了人们的需求和欲望,并存留海量数据,反身滋养和优化技术发展,由此构成“技术与技术”“技术与人”之间的多重交互和共同演化。本文与可供性理论对话,将处于应用软件交互界面背后,隐匿于平台系统核心位置的“数据基础设施”作为动态的、成长性的媒介加以讨论,分别从企业内部应用软件联通、企业外部跨平台应用软件联通、 应用软件作用于人三方面探讨数据基础设施的可供性和可供力,以及更为复杂的“人*应用软件”所构成的新技术环境对数据基础设施的反向可供性。基于此,提出了数据基础设施作为隐蔽可供性所具有的可供力的分析框架,向纵深推进了媒介可供性理论,为平台和软件研究以及媒介实践提供新的思考角度。


作者简介

马中红,苏州大学传媒学院教授。


胡良益,苏州大学传媒学院博士生。


基金项目

本文系国家社科基金项目“青少年女性数字媒介文化实践研究”(项目编号:19BXW112)、江苏省研究生科研与实践创新计划项目“网络平台可供性视角下青年文化‘出圈’现象研究”(项目编号:KYCX21_2912)阶段性成果。





引言


以微信、抖音、支付宝为代表的应用软件深度参与并改造人们的日常生活、文化实践和社会发展。人们使用应用软件的行为以数据形式进入平台系统,进而演变为一种混合形式的“平台社会”(Van Dijck,2018:12-16)。人—应用软件—平台系统相互依存、嵌入、掣肘的复杂关系进入平台研究的考察范畴(Plantin & Punathambekar,2019)。平台不仅形塑了人与技术(机器)的结构性关系,而且提供了人与技术供给的互动关系。一方面,人们通过应用软件获得“可感知”的行为收益和关系联结,另一方面,人们又被迫同意或系统默认同意地将自身行为转变为数据。就前者而言,现有研究倾向于将平台技术“定义”为一种功能属性的存在,是用户作为技术使用者发挥能动性的单向考量,故而仅能呈现出因果分析的“必然结果”。即便有研究以媒介物质性的视角去考察平台作为“物”的能动,但也只将研究对象局限在“平台应用”上,而非促成平台施效的“隐藏物”,比如缺少对数据的考察。这会产生两个结果:一是过分强调“人之能动”,而对软件应用的“基底”视而不见。二是,平台技术并非是固定的、不变的,而是时刻处于流动的变化和更新中,那么,将平台视为一种明确的技术可供,对于现象的解释也就只能停留在宽泛的“工具使然”层面。就后者而言,最为典型的案例就是,用户在现实生活中交流的内容,时不时会以广告的形式出现在微信朋友圈、软件首页或搜索栏,也会“巧合”地发现,在某个应用搜索的内容会出现在另外一个应用的推荐页面上。由此产生的问题是,我们的数据为什么会在不同平台中流动,为什么又“恰好”满足我们的心之所需?


那么,人与平台的讨论不能只局限于智能手机中应用软件的讨论,特别是微信、支付宝的“一键登陆”其他平台,或是别的应用入驻这两个超级平台时,已然收获了远超社交或支付范畴的大量数据,人与平台的关系就不再局限于“点对点” 的可见范畴,而是被置于一套隐蔽且复杂的网络系统中。这再次警示我们在思考人与技术的关系时,要克服简单的“服从-支配”的单向度关系(Castells,2000)。以上种种,都在要求我们跃过可见的技术表层,向纵深处、向隐蔽处望去。事实上,支撑平台运行、优化技术功能的关键在于对数据的利用,或者说,数据的采集、挖掘、算法、分发正以一种我们看不见的方式,将多个平台、应用、功能以数据流动的技术形式组接在一起,就像微信嫁接滴滴、抖音联合淘宝,从一个技术接口(technical interface)逐步转变成一个嵌套系统(Nested System),这不仅是将人紧紧地裹挟在其中,更是人与技术共同创造出的一种纵深的、隐蔽的、闭环的新技术系统,对此的考察在现有文献中鲜见涉及。


有鉴于此,本文沿袭可供性(affordance)的理论视角,试图通过考察互联网企业的平台技术系统、数据使用与用户参与,探讨应用软件与其背后的数据技术的可供性。在使用平台传记(Platform Biography)研究方法的过程中,发现互联网业界有大量关于数据技术是如何创造以及被如何使用的文献。这里所说的“平台传记”,主要指通过二手资源来观察平台的演变过程,包括博客档案、技术报告、年度总结、公开声明、第三方网站等公开的话语文本(Burgess & Baym,2016:10)。我们从中借用了一些术语并与学术概念进行对话和转化,以推进技术可供性的研究。与此同时,为避免平台传记描述的偏面性,我们还对10位用户进行了深度访谈(下文编码A1-A10),行业涉及IT技术人员、电商从业人员、内容创造者、媒体运营商、普通用户等五大类,所在地位于上海、南京、苏州、深圳等,了解用户关于应用软件、跨平台使用、数据流通的真实体验与想法。访谈前,会告知受访对象的研究目的,进行1小时以上的访谈,并已征得受访者同意进行经验材料的研究。


看不见的技术物:数据中台与数据基础设施


当下业界集中关注的一个技术架构是所谓“中台”(middle platform)。在全球数字生态大会(昆明,2019)上,腾讯高级副总裁汤道生提出要“开放中台能力,助力产业升级”。这就意味着,腾讯旗下各款应用软件,如微信、QQ、腾讯视频等所搜集到的数据将汇集到中台,实现数据的共享与流动,并被腾讯允许的任意应用软件接入和使用数据中台所存储的海量数据,使平台进化成一种可被编程、不断延展、持续更新的“成长性”系统。在企业看来,中台可被视为一种协调应用软件前台和硬件后台之间的技术系统,而应用软件前台主要指与人与交互界面接触的应用软件,硬件后台一般指维持前台运转的后端系统。


之所以需要中台,是因为应用软件的前台,特别注重即时性满足、使用体验优化,而后台系统则要求平台稳定,如此,很容易出现前台需要更新功能、而后台无法满足的“匹配失衡”的情况。中台,作为一种调和“匹配失衡”的“缓冲齿轮”,一方面将应用软件中稳定的通用业务“沉降”到数据中台,以保持前台积极响应,另一方面又将后台需要频繁变化或直接支持前台的业务模块“提取”到数据中台,为前台提供强大而灵活的“炮火支援”。更为重要的是,按照功能定位,中台将平台架构“划分为一个相对稳定的核心和一组鼓励变化的互补模块”(Tiwana,2013:677)。也就是说,平台系统通过“设计规则”(共同目标或共享协议)将平台系统中的多个利益相关者建立起关系。如此,便为外部系统扩展者、企业内部共建者和用户之间的交互,提供了一个开放的、可参与的数据基础设施(data infrastructures),以允许多个利益相关者协调他们的服务和内容需求(Costantinides,Parker & Henfridsson,2018),这恰恰为平台社会提供了必要的技术基础。


更准确地说,平台之所以成为社会基础,并非只是眼前的、不同平台应用对日常生活的全面嵌入,更在于内置于平台中的数据中台以看不见的技术功能和海量数据,悄然将平台转设为一个可编程(programmability)的计算系统(Bogost & Montfort,2009)。数据中台不仅保留着普遍性、可靠性、隐形性和故障性等传统基础设施的特点,更专注对数据进行持续、密集、集中的提取与再利用(Chen & Qiu,2019),促使中台加速完成基础设施化转向(infrastructural turn)。它一方面既可作为技术层面的基础设施接口,将各种网络行为、不同平台服务以数据的形式进行不可见的基础设施工作(Alaimo & Kallinikos,2017),而且组建并形成“网络的网络”(networks of networks),使平台持续拓展用户规模和全面渗入日常生活,进而获得“基础设施”的数据化特性。


具体而言,数据基础设施包括三个主要的技术架构:海量数据流入、存储并分析的数据湖(Data Lake);汇集所有用户数据的消费者数据平台(Customer Data Platform);对数据进行筛选、分类、预设、洞察的数据管理平台(Data Management Platform),三者互联互通,完成对用户需求的匹配、满足和再生产。 基于上述技术架构,数据基础设施具备以下鲜明特征:一是庞大的元数据存储;二是对数据进行高级算法处理;三是决定应用软件界面内容呈现;四是控制外部应用软件的介入和接入。这意味着,数据基础设施基于海量且跨平台的数据,通过指定计算命令,将元数据转化为可输出的“服务体系”:以指标、数据、标签的编程形式去供给一套具有深度的、个性化、精准的“用户模型”,进而以一种蚕食性的“拓展力”去主动构建人的行为模式,完成如今日头条创始人张一鸣所设想的“不需要用户进行任何选择的”个性化推荐(朱鸿军,周逵,2017)。那么,从“人被动寻找感兴趣的内容”到“内容主动定位到感兴趣的人”(陈昌凤,翟雨嘉,2018),再到构建和预设指定的人去匹配对应的内容,这一系列的关系变化都表明数据基础设施作为一种不可见的技术环境,正在以不为人知的方式,不断地改写人与技术的关系,拓展、延伸技术可供性。


从可供性理论到“隐蔽可供性”


可供性(affordance)由美国学者詹姆斯·吉布森(James Jerome Gibson)于1978年提出。吉布森以此概念强调,有机体在特定场所行动的可能,取决于有机体与环境之间,并经由有机体的感知所形成的特定且独立的关系(Gibson,1979:125)。在这种关系中,有机体可能采取相应的行为以收获意义,环境显示其为特定行为提供的可供力(Majchrzak,2013),既是感知与行动之间的自然反应(Gibson,1979:73-76),又是人的行为与环境之间的互能(complementarity)(Gibson,1979:127)。这种人与环境的动态适应(adaptation)和平衡掣肘的关系,很快被工具设计(Norman,1988)、人机交互(Haugeland,1993)等领域关注,逐渐发展成一个相对成熟且丰富的理论体系,并形成以下两种主要的研究路径:


其一,强调有机体所感知的、使用的东西,以及理解并融入环境的主要方式仍由环境所决定(Norman,1999)。这给予传播学界的启发是,特定技术所产生的工具环境是如何影响社会行为和交往的问题(Boase,2008)。比如,不少学者提出技术可供性(technological affordances)(Gaver,1991)、社会可供性(social affordance)(Wellman et al.,2003)、传播可供性(communicative affordances)(Schrock,2015)、媒介可供性(media affordance)(潘忠党,刘于思,2017)、平台可供性(platform affordance)(张志安,黄桔琳,2020)、算法可供性(algorithmic affordance)(皇甫博媛,2021)、时间可供性(temporal affordance)(王海燕,范吉琛,2021)等,在讨论技术作用的同时,也证明了工具、设备或平台具备某种无法限定的操作潜力(Gillespie,2010)。不过,这种对于可供性的“微调”,可能会导致人之于环境本能触发的能动性(agency)存在“被工具环境建构”的风险(孙凝翔,韩松,2020)。因而,忽视赋能(enabling)和限制(constraining)的互补关系(Hutchby,2001),甚至将可供性让渡于环境的工具/技术属性。


其二,已有研究意识到可供性不可化约为简单的工具属性,故而将不可限定的人之能动重新纳入可供性的讨论范畴,进一步延伸可供性理论的弹性与解释力。比如,想象的可供性(imagined affordance)强调用户感知、态度和期望之间的关系网络,刻意忽视特定可供性的存在(Nagy & Neff,2015);实践的可供性(affordances-in-practice)则主张技术环境的可供并非稳固,而是在不同的文化语境中持续发生变化(Costa,2018);关系可供性(relational affordance)提出,将可供性作为技术、用户和环境之间交互的产物(Willems,2020);更有研究试图以语境崩溃(context collapse)的概念重释可供性,强调要将社会情境中的多种因素纳入考察,比如能动、结构、资源和复杂性等,而非仅从人的行动/技术的影响端出发(张杰,马一琨,2021)。


上述路径虽然在一定程度上延展了可供性的范畴,但似乎忽视了可供性关于动态交互的本质,使人与技术环境的讨论仍陷于割裂之中。一方面,可供性被想当然地“固定”在某一特定的领域、范畴或技术框架内,或是将操作效果视为技术的一种自然结果,缺少对可供性理论的再建构(Evan et al.,2017)。就平台技术而言,可供性“不是在人与技术的交互中显现,而是一种异质集合,并由人类行动者与非人行动者持续不断的多重内部行动所生成的”(胡翼青,马新瑶,2022),可能涉及与之相关的多个部门的参与者(Ettlinger,2018),这远比吉布森式“有机体/环境”关系的讨论要复杂得多。进一步说,对于技术环境的讨论不能再固守吉布森式“稳定的”环境,必做考虑到数据的请求、聚合、操作和计算,进而实现技术环境持续、流动的变化与再驱动(Scarlett & Zeilinger,2019);另一方面,即便那些将其他维度纳入多元技术环境的讨论,却依旧困缚于“使用与被使用”和“可见维度上”的保守范畴中。事实上,人与技术环境相遇的潜在能力早已远超可见的、操作的交互界面,其能力被无形地嵌入在一系列编码操作、网络基础设施、软件应用之中(唐士哲,2020)。也就是说,所谓的“人之能动”极有可能是来自于应用软件交互界面“表象环境”或“可见技术”的一种虚假的应用性把握,而更重要的是,通过一系列操作行为后的数据生成与供给,“人之能动”成为了一种“有生命的”数据环境,进一步将软/硬件、设备、技术嵌套(nested)在一起、使之串联(cascading),并时刻与“作为技术环境的人”共同进化(co-evolution),从而为现有技术环境解除“稳定的”限制,使其时刻保持在活跃状态。


由此出发,数据中台似乎成为了一个复杂的、带有集置性质、影响多个方面的中介:它既决定着技术功能的表现,又连接着不同的硬/软件,还影响着具体的人,这启发我们不能将视野停留在可见的操作界面,而应向交互界面的纵深处、不可见处望去。不同于以往显见的技术可供性,当数据中台作为某种可供时,我们是无法感知、也看不见的,同时它又是真实存在,并持续流动、变化的。数据中台隐没在功能设备、平台技术中,而且它可靠(基于算法推荐)、透明(感官上看不见)、广泛共享(无处不在),只有当数据中台突然停止供应和运算,使整个社会处于停滞状态(Edwards,2002:186-188)时,人们才能感受到它的存在,正如由可见的微信入口登陆健康码遇阻时,其背后的数据系统才显示其存在感。那么当下,互联网平台对日常与公共生活全方位渗透,“人—物—场”都转换成为数据的生成、搜集、处理和再利用(Langlois & Elmer,2019),并由数据中台中介,从这个意义上来说,数据中台就是数据基础设施。


常被忽视的是,当封闭的平台模式开始转向基于数据基础设施的平台生态系统时,不仅意味着数据流(data flows)成为技术逻辑的起点(Van Dijck & Poell,2013),更在于先前单一的技术功能实际上是由一套复杂的技术系统在决定,使可供性彻底隐藏在基础设施、设备、应用程序、功能等多个层面(McVeigh-Schultz & Baym,2015)。一方面,这种不可察觉的隐藏,被研究者视为一种“维持功能可见的隐形基础设施层”(Parikka,2015:216),强调算法逻辑和不可见的数据处理可以潜在影响社会;另一方面,它也受到看不见的基础设施层面(infrastructure layer)、可操作的中介层面(intermediate layer)和跨平台的行业层面(industry layer)等多个层级影响。由此进一步追问,又是什么在影响上述层级的作用?抑或是说,数据基础设施与平台系统中的不同层级存在怎样隐蔽的关系?当下人们日常接触的互联网平台都在使用数据流接入后台基础设施的技术机制,因此了解数据基础设施在平台生态中的分层可供,是掌握权力分配的关键(Castells,2009)。


有鉴于此,我们认为,数据基础设施的可供性既“消失”在视野之中,又隐藏在平台技术的不同层级中,同时还以一种不可感知的动态变化,持续影响着平台的运行机制和社会逻辑。在这里,消失、隐藏、不可见等数据特性,既描述了算法在配置数字信息和物理现实空间之间的直接关系,同时也代表了一种可供性,用于确保这种关系在互动中被触发和持续更新的动态本质。为此,本文从数据基础设施视角,对平台系统的可供性进行重新审视,突出这种动态、变化、活力的交互关系所具有的隐藏潜力就很有必要,比如(1)数据基础设施是如何针对平台生态系统的不同分层(layers)产生不同的可供力,其中内在的技术肌理是怎样的?(2)当人开展数据化行动时,人与所在的技术环境之间是否发生变化,它以何种形式嵌入到技术本身的运行逻辑中并产生怎样的影响?(3)人与技术环境除了赋能与限制关系外,是否还具备共同成长、持续变化的潜能,数据基础设施的可供性是在这种不确定的状态中,不断建立、重连、更新、变化(Sharma et al.,2016)的吗?能否发展出一个具有实验操作性的研究框架,在将可供性理论向纵深推进、恢复动态思考的同时,可以帮助我们更好理解平台社会的技术逻辑?


“数据基础设施”隐蔽可供性分析框架


就技术可供性而言,应用软件交互界面是人机交互的触点,能直接让人感受到应用软件、平台作为工具技术提供的可供力。但是,当人们在淘宝购买商品时,不应误认为只是淘宝这款应用软件提供了行动可能,实际上个人偏好数据支持了有选择、有意识的信息推送,这反映出人与环境间呈现出某种可能的效果联系。本文将围绕数据基础设施主要的三种技术形式:客户数据平台、数据管理平台以及数据湖,勾勒其对人、对企业内部自应用软件、跨企业平台应用软件、以及“反制”平台的可供性框架,挖掘那些明确的,却又未曾察觉的、隐藏的可供力,进而推衍出一套平台系统中不同分层间多重互动可供性的分析框架。需要注意的是,数据基础设施的可供性虽然由三种不同的技术形式触发,但本文无意追寻不同技术产生的不同可供性(力),而是将其视为一个整体,以关注特定的技术系统是如何生成数据,并以此作用于不同的平台层级。或者说,数据只有在不同技术中流动,才能释放不同可供力的潜能,而这也正是把握数据基础设施隐蔽可供性的关键。


(一)数据基础设施对企业内部自应用软件的可供性


早在2012年,腾讯就已明确自身定位,要做的是“互联网的连接器”,实现社会关系的广泛连接(腾讯开放平台,2012)。十年过去了,现在腾讯官网赫然写道:“汇聚腾讯公司全量的应用场景,基于海量商业数据的服务能力,结合云计算、小程序、移动支付等前沿技术和应用创新,实现全链路的数字化服务。”全量的应用场景,意味着腾讯旗下的所有产品数据被打通使用,包括但不局限于微信(月活12.88亿)、QQ(月活6.48亿)、腾讯音乐(月活8亿)、腾讯视频(月活2.3亿)等内部应用(腾讯,2022)。难以想象,这将是多么大的数据体量。也就是说,用户的社交、娱乐、购物等日常数字行为都转化成了数据,一方面使软/硬件获得更多数据,进行扩张和升级,以一种人工智能系统的输(input)来源,用以持续更新算法,强化与人之间的联系;另一方面,全量的数据也以潜移默化的技术介入,促进人对于软件的访问、操作,甚至依赖。


在此情形下,数据基础设施首先以一种隐蔽的数据流动、配置与再分配,使企业内部的所有应用软件得以互联互通。其中,客户数据平台连接用户所有的触点及运营工具,包括应用程序、登陆网站、支付数据等,在汇集所有客户/用户数据的同时,将其传递分发给有需要的应用软件。数据管理平台不仅可以把分散的第一方(多个应用软件的运营数据)、第三方(数据供应商和企业网站)数据纳入统一的技术平台,还可以把这些数据按照标签、属性进行结构化归类,进而整合为有关联的数据,并进行深层次的价值探索。数据湖,顾名思义,成为存储各种元数据的“湖泊”,以更好地支持预测分析、跨领域分析、实时分析以及多元结构化数据分析(数据甄小白,2021)。经由这些有关连接、整合和分析的数据供给,数据基础设施形成用户、渠道、智能三个方面的可供性,并围绕此形成可支持、可覆盖、可沉淀、可扩展、可协同、可统筹等数种可供力。


数据基础设施的最大功效在于它是负责提取、存储、共享、分析的数据集合,这种集合是支撑当下应用软件所有业务形态和快速运转的基础。换言之,数据基础设施的“可支持”优先确保人可以任意地“出入”和使用被授权的不同应用软件,“我现在很少再注册别的平台账号了,太麻烦,直接拿微信一扫就登陆了,很方便”(A4)。这些数字行为均可转化成数据,流入数据湖,持续不断地优化数据生产者/人的画像,完成综合分析,“之前我刚跟朋友聊完什么车比较好,还没过十分钟,朋友圈就收到了这个车的广告,简直离谱”(A1)。基于此,数据基础设施围绕用户可进行全触点的“可覆盖”,比如线上部分的PC/H5/APP/小程序,线下部分的智慧门店、经销商门店、品牌店等已形成全渠道接触用户的能力(邓建星,2019)。可以发现,只要用户触发应用软件界面,生成数据,就能被数据基础设施的多项可供力持续地供给,更关键的是,数据基础设施可以根据用户在不同平台、不同品牌、不同组织、不同模式中的状况进行统一管理,凭借数据的“可沉淀”形成精准的终端触达,从而完成更高效的价值转化(腾讯广告,2020)。


值得注意的是,最初用户与应用软件是单项配套结构(比如阿里旗下的天猫与淘宝之间的用户数据无法共享),容易形成“信息孤岛”,而数据基础设施将各应用软件打通,使数据畅通无阻。按照阿里的说法(列文,2019),“基于全链路全渠道数据建立以人为核心的数据连接萃取管理体系,对用户进行全生命周期的精细化管理”,即全渠道的“可扩展”“多链路的可协同”以及多主体的“可统筹”。具体而言,基于数据基础设施的渠道,“可扩展”使不同业务之间展开横向的数据搜集与供给,比如用户在天猫的搜索记录以数据方式流入阿里的“数据湖”,再以此优化后的数据服务于该用户在淘宝的内容推送,反之也成立。全链路的“可协同”意味着,围绕某个独立项目所进行的纵向深度协同,比如售前企划、售中管理、售后处理、使用反馈等一系列过程的调度;“可统筹”则表示综合上述横、纵两项所生成的第三种可供力。“我们是在淘宝卖包的。淘宝提供的数据很清晰,买家喜欢的款式、大概的价格,这能帮助我们在不同的时间节点调整销售策略,之前我们都是靠经验判断,要么就是看别人定价多少,其实非常被动”(A7)。


如果说使用(交易)数据反映的是人的整体性特征,那行动偏好的数据则表现出人的习惯、爱好、需求、倾向、性格等细节性描绘,对此的分析主要体现在数据基础设施的智能性可供性方面,这一点通常被学界解读为算法或智能推荐,在业界被称为“多维智能定向”,即通过海量的腾讯账号体系,实现千万级的人群智能投放,自动匹配更多高转化人群(腾讯广告,2022)。通常的操作是,用户下载应用软件之后,对弹出的“协议通知”之类,大多数人只能选择“同意/接受”,这就准予数据基础设施深入用户行为的“腹地”,对每一次的点击、分享、聊天、停留、关注、打赏、搜索、浏览等进行“可记录”的数据化操作,再配合技术进行系统分类整理,形成规范的、标准的、紧密结合场景的可扩展的标签体系,体现出数据基础设施的个性化特征。“我看抖音直播,只要点进去一个博主的账号主页,后面即便不关注,还是可以一直收到对方的推送,即便我点了‘不感兴趣’,可还是会推”(A2)。


(二)数据基础设施对外部跨平台应用软件的可供性


长期以来,不同主体的平台之间相互封禁引发关注。字节跳动发布2018—2021年遭腾讯屏蔽和封禁的大事记,显示腾讯封禁抖音、西瓜、火山、飞书等应用软件,甚至连上线H5、小程序都被禁止,波及用户超10亿(毛天婵,闻宇,2021)。工业和信息化部(2021)举行“屏蔽网址链接问题行政指导会”,要求各平台限期解除屏蔽链接。字节、腾讯、阿里均表示要落实、要开放、要互通,然而直到现在,抖音视频依旧无法直接跳转微信,淘宝、天猫也还是无法使用微信支付。从平台的角度出发,“禁令”为的是减少核心资产——数据的外流,这同时意味着,数据基础设施作为一种共享的技术架构,可通过相应的协议,允许更多的用户、第三方应用商、其他应用软件等异质性主体进入,也可以封闭,隔绝其他主体“入侵”。也就是说,数据基础设施在各类跨平台的、分散的、异质结构的应用软件之间创造了相互操作的可能性,成为跨企业跨平台组建网络共同体的基础设施,这使得数据基础设施对外部跨平台的可供性表现出“可编程”“可创设”“可连接”“可共享”和“可限制”等诸多可供力。


最典型的案例,莫过于微信应用软件与小程序、第三方应用之间的协作关系,实现跨平台服务的同时,也意味着微信成为用户寻找服务的一个入口,更使用户具备了一键登录多个平台的权力(腾讯科技,2011)。在一定意义上,达成共识的网络协议(准入标准)允许任何人或应用软件对接“微信—腾讯系”的数据基础设施,并借助强大的数据支持对应用软件进行编码、链接、开放等操作,获得“可编程”的可供力,不断为使用者提供新的可能。


更重要的是,这种“编程”非但不需要征求用户同意,反倒在用户不知情的前提下,不断加深用户与平台的捆绑关系。在2022微信公开课PRO大会上(腾讯, 2022),多位负责人表示,微信小程序的日活用户已超过4.5亿,正如受访者A9所言,“购物平台有的选,但社交软件没得选,因为大家都在用微信。我现在只要一个微信就够了,能聊天、能付钱、能打车、能点外卖,干啥都行”。这意味着微信背后那个庞大的、隐形的、持续增量的数据基础设施具有“可创设”的可供力,决定着不同应用软件之间进行数据访问与交换的标准或者约定(束开荣,2020)。从用户视角看,微信小程序集成了人们在不同平台中的使用行为;从外部的接入来看,微信小程序横跨安卓端和苹果端,理论上向所有小程序提供获取腾讯旗下的用户数据接口;从平台自身而言,微信是一个闭环的生态系统。微信事业群总裁张小龙这样定位微信:“既然有非常多的用户,我们就应该提供一个平台,让所有有才能的人都能利用这个平台去触达他的用户”(腾讯科技,2016),这实际上也体现出数据基础设施“可连接”的功能优势,进而从“开放生态”演化为“生态开放”(腾讯云,2019)。在此意义上,微信只是具有使用功能的“接触界面”,真正的“驱动力”是其背后的数据基础设施。


唐纳·哈拉维(Dona Haraway)曾说,“只要提供合适的标准、编码,以一种通用语言来处理信号,那么任何组成部分就可以彼此交互”(Haraway,1991),数据基础设施实现更大范围的交互和再生产的潜能,尤其表现在“可共享”的可供力。2018年,用户不仅能在抖音看到淘宝的历史搜索信息,而且抖音也支持直接跳转淘宝的商品链接中(钱玉娟,2020),如此表明淘宝的用户行为记录传递给抖音的数据配置文件中,以此通过数据跟踪来定制个性化的广告推送和优先级排序,两个超级应用软件的数据基础设施在彼此约定的范围内互通共享了。不过,当下国内互联网大型平台显然都不乐意向竞争对手开放数据基础设施,一项基于5324份问卷的《“互联互通”用户认知和态度调查报告》显示,有59.20%的用户遭遇过“复制黏贴乱码才能分享”的问题,有51.58%的用户遇到过“必须下载指定APP才能查看内容”的问题(马中红,吴映秋,秦敏杰,吴宇轩,2022),也就是说,腾讯系的数据基础设施具有可连接、可共享的可供力,但即使在国家层面实施“互联互通”的要求之下,禁止跨平台链接,封禁平台外部的链接,或为链接制造种种麻烦,依然是一个事实。


(三)数据基础设施经由应用软件对人的隐蔽可供性


基础设施的本体论特征在于它既是物质的,又是物质之间的关系,并能以物质的身份促使其他物质“变化”。比如,当我们使用应用软件时,发起操作指令的是交互界面,而支持输出反馈的是数据基础设施,这就好比我们看到的是水龙头和水,而非管道和下水道。由于数据基础设施的不可见性,其可供力许多时候是隐藏的,而学术界对应用软件交互界面“媒介可供性”的讨论,不仅忽略了这种隐藏的可供力,而且将人机交互界面的感知归结于使用者的主观能动(Vitak,2015),如此遮蔽了真正创造技术环境的数据基础设施。客户数据平台通过数据的互联互通,将用户在各个应用软件和平台的行为轨迹汇聚成“数据湖”,再配合数据管理平台的第三方数据(比如记录和利用用户在网络中的行为轨迹),进行智能排序和引导,从而对用户群体进行精准投放。由此,数据基础设施经由应用软件使用,为人提供可沉浸、可私有、可在场、可链接等隐藏的可供力。


我基本上都用腾讯的产品,是因为还在上学的时候就开始使用了,也就懒得再去注册新的软件了。还有就是,这种大平台的软件功能比较丰富吧,我就很讨厌单独为某个事情再去下载一个软件,我宁可不用(A2)现在的app好像不是单纯使用那么简单了,还有一种上瘾的感受,几乎每一个软件都这样。总觉得再刷5分钟就可以不玩手机了,可怎么也停不下来(A5)


以上两种说法在访谈中,非常具有典型性。数据基础设施得益于互联网企业内部自应用平台和外部跨应用平台源源不断的用户数据的输入,同时也由此具备为各平台“造血”和对用户提供全面精准供给的可能性。就企业内部的自应用平台而言,以腾讯为例,除熟悉的微信、QQ外,还发展了游戏、视频、直播、新闻等业务方向,同一个人在这些应用软件中分别留下的使用和消费数据,已经完全可以互相流转和再利用,构建起了一个真实的“虚拟人”。尤其是,微信小程序加载第三方业务(外卖)、微信支付对接传统的基础服务(电费)、应用宝连接跨平台应用(携程)等,使用户留下的数据可被充分共享,进一步填充了“虚拟人”的身份细节。


换言之,任何应用软件、平台、场景中都存在流动的人的信息,这就使得用户在接触任何一个应用软件交互界面时的“陌生感”都可能被数据基础设施消泯,从而被嵌入一种熟悉的偏好预设中,并从不同渠道继续收集用户的数据,使之更完整、更优化、更精准,形成一种流动的“可沉浸”闭环。“可沉浸”的独特可供力,一是循诱用户主动地进入应用软件交互界面(Nielsen,2010),二是持续地进行智能推荐,生成极具个性化的内容。在此基础上,“可沉浸”衍生出三股相对应的可供力:首先是“可私有”,应用软件在数据介入下,逐渐积聚起私人化的数据集,并生成“千人千面”的偏好推荐。“可私有”的本质是对人的偏好内容进行限定性的“围栏圈界”,从而获得形塑交互界面的个性化可供力,正如阿里云的程序员不无自豪地认为“我们现在已经能够做到全中国几亿人口的淘宝界面都是不一样的,而且几乎做到了秒级更新”(张雪,2020)。可私有化的过程融入了人的基本属性、消费能力、行为特征、兴趣爱好以及社交关系等,以进行全方位的个人构建,并因人的持续接入而生成“虚拟人”的自我发展动力。其次是“可在场”,人的信息行为已经被彻底转化为一项共享数据,在数据基础设施流入和流出的同时,也是与应用软件进行不间断的交换过程,暗示着“我”以数据的形式获得在不同应用软件中的持续在场;最后是“可链接”,通过在应用软件上使用各类数据插件,在扩展平台生态系统的同时,进一步绑定用户,使其形成对平台的深度依赖。


(四)“人*应用软件”新技术环境对数据基础设施的反向可供性


有机体是否真的获得关于特定可供性的能力并利用它,重点不在获得和利用的结果,而在于具备实现可供性的可能(Bærentsen & Trettvik,2002:51-60) 。当数据基础设施具有决定最终可能性和提供给人潜在机会的能力的情况时(Sengers & Gaver,2005),也在暗示,技术在使用中可能也被人所“塑造”(Graves,2007)。即,可供性既不属于技术物,也不属于人,而属于人与其所处环境的感知关系中(Parchoma,2014)。如此理解,可供性便在“人—应用软件—数据基础设施”的相互作用中激活,恢复其间的动态变化关系,从而跳脱出工具属性的功能主义局限。也就是说,人作为应用软件的使用者、应用软件作为人机交互的界面,两者融合并形成了一种“人*应用软件”的新技术环境,其可供性远远大于单向度的人使用应用软件。


因而,“人*应用软件”新环境对具有机器学习等“自主意识”的数据基础设施同样具有可供性,也就是新技术环境对数据基础设施的“反向可供性”。它们通过不断的“数据喂养”,使其以机器学习的方式获得“仿人”意识。也就是说,数据基础设施是凭借“人*应用软件”的各种行动逻辑、操作响应、需求指向,人作为异质的技术环境对数据基础设施有反制的能动。作为粉丝的受访者认为,“我其实挺害怕热搜的,非常担心我喜欢的人(偶像)会出现不好的新闻。即便是有点争议,我们也会想尽办法去降低热度。比如,我们可能会故意在搜索栏中输入与热搜主题相关、但意思相反的词条,尽量减少微博的关联推荐,或者选择将别的话题冲上热搜,就能减少对我们的关注”(A8)。可以认为,“人*应用软件”新技术环境的可供性足以强大时,数据基础设施便会受到获得了“可进化”的可供力,时刻受制于作为技术环境的人的影响。


基于此,在发展与进化的角度上,“人*应用软件”对数据基础设施的社会性运行施加选择压力(selection pressure)(Reed,1996:58)。“我从豆瓣的反技术依赖小组里,学到了一些摆脱手机依赖、算法规训的技巧。所以,我可能会故意输入一些平时一点都不感兴趣的内容,让后台来中和一下我的推荐偏好。或者用技术打败技术,比如我开启青少年模式,强制规定使用时间”(A10)。数据基础设施对外的功能覆盖、对内的数据处理,不仅是主动适应“人*应用软件”新技术环境的过程,还是积极改变自身环境,保持生存的一种必要手段,这里体现的是一种“可选择”的反向供给力。只有摸索出“人*应用软件”环境规律和把握数据基础设施内部自身的运行逻辑,平台才能更好地生存并发展。


与此同时,数据基础设施起源于人之行为的海量数据记录,这就意味着,“人*应用软件”新技术环境反身滋养和优化数据基础设施,使其成为一种具有自主学习能力的平台系统,去思考完成某个特定推送信息,或拓展其他功能。比如,最初短视频的定位是社交分享,而当用户分享的内容具有未被挖掘的商品属性(如民间特产、手工制品),以及用户的主动行为(如夸赞、询价、购买等),迫使数据基础设施增设购物、直播、物流、定位等功能。因此,数据基础设施“意识”到“人*应用软件”的供给可以创造新的内容和新的活动,从而在适应“人*应用软件”的过程中获得“可学习”的供给力。已有实证研究表明,人在使用相同的技术功能时,会反映出不同结果,甚至自相矛盾,由此体现出技术作为一种可供性的可变属性(variability)(Evans et al.,2017)。从这个角度而言,“人*应用软件”新技术环境所提供的“反向可供性”促使数据基础设施(或“平台系统”)必须考虑这种可变性,并且实时更新和不断适应“人*应用软件”新技术环境。


图1:数据基础设施可供性分析框架


至此,我们通过“可见的”经验材料绘制出了不可见的数据基础设施可供性的分析框架,在一定程度上揭示了数据是如何在隐蔽的应用软件身后生成、流动和作用的。在这个意义上,作为数据基础设施的中台成为了企业内部自应用和企业外部跨平台的“接口”,一方面让所有得到授权的“参与者”与平台系统进行沟通、交互和互相操作,另一方面也无限扩展收集数据的渠道,进而在无形中左右了应用软件的技术表现,也使人陷入一种无法逃离的平台逻辑中。当然,这不是说数据基础设施在与人的相处中占据决定地位,恰恰相反,人之行为的一切构成了数据基础设施得以运行、施效的基础和关键。也就是说,人之无法限定的能动和被架空的“前台应用”,共同塑造出的“新技术环境”与隐蔽的数据基础设施相互赋能、掣肘,这不单是恢复了吉布森关于可供性的动态本质,也进一步突破了可供性对于“固定环境”的有限理解。


结语


本文超越平台研究中对应用软件交互界面和抽象的算法研究,一方面透过日常使用中最显见、可感知的软件交互界面,发现了平台系统中不可见、但具有重要作用的数据基础设施,另一方面以此反观数据是如何串联起不同的物质层级,进而掌握平台系统内在的技术逻辑。在此基础上,借鉴并发展可供性的理论视角,提出“隐蔽可供性”,对数据基础设施所迸发的多重且隐蔽的可供力,进行解析和归纳提炼,主要围绕数据基础设施与企业内部自应用软件、企业外部跨平台应用软件、 经由应用软件作用于人三方面所形成的可供力,以及“人*应用软件”重组的新技术环境对数据基础设施的反向可供性展开研究,基本建立了数据基础设施作为隐蔽可供性的分析框架,向深处推进了媒介可供性理论的讨论,对平台生态系统、人机关系等方面提供了新的认知。


研究发现,首先,“数据基础设施”已经成为互联网平台生态系统的标配,深藏在各式应用软件的背后,随时回应、评估、预测应用软件和用户的感知与需求,使先前“人与应用软件”的交互关系变成“人与平台系统”的全面双向嵌入。其次,处于纵深位置的数据基础设施,一方面将不同维度的应用软件互嵌在一起,使之成为庞大的平台生态系统,另一方面又对技术系统的软件与人,提供外界不为所知的可供力,成为“人与技术”结构性相互作用的结果。再次,数据作为一种特殊的、不可见的基础设施,其属性与传统基础设施存在明显差异,它不是固定的、不变的,恰恰相反,它时刻处于流动和变化之中,需要借助人的行为数据持续不断的输入以维持和优化数据环境,因而是一种成长性的媒介,是可引导和可改变的。最后,数据基础设施依赖于“人*应用软件”新技术环境所生成的数据,如此,看似强大无比的数据基础设施也很容易陷入“赋能”受到“限制”的困境,也就是说,“人*技术”融合所生成的新技术环境对数据基础设施具有“制约的”反向可供性,而这常常被忽略。


基于此,本文的创新之处在于两个方面:一是,拓展了对平台基础设施的理解。较之以往,平台因为全面嵌入人们的生活,被想当然地理解成一种基础设施。然而,本文发现,平台基础设施的关键并非在于应用服务对生活的全面嵌入,而是在于其背后看不见的数据基础设施以一种数据流动的形式,将众多平台嵌入在一个技术系统中,这是平台社会成型的原点。它一方面以一种隐蔽的,但却真实发挥效力的二进制形式,延伸为基础设施的“新范畴”,另一方面整合平台、又超越平台,成为社会广泛连接的接口,如此将人与技术的关系考察向不可见的纵深又推进了一步。二是,对可供性理论进行了延伸,以数据基础设施的隐蔽可供性框架提供了新的理论资源。本文试图跳脱出人与环境(技术)割裂的可供性讨论,不仅考察了技术环境对不同应用、平台等其他“环境”之间的可供关系,也将“人”视为一种新的技术环境进行反制,进而将“人与环境”的对立关系悬置,以一种“互为主体”的新视角来考察人与技术的复杂关系,这对于为我们重新理解平台社会、技术伦理、软件研究、媒介实践等提供了新的思路。更重要的是,这种“互为主体”可进一步被拆解为“人与多个异质主体的集合”。这意味着,数据基础设施的行动者网络还可能隐藏着更多的非人行动主体(比如用户协议、功能按钮等),它们一方面居于日常、但同样隐蔽的位置中,并产生不容忽视的关键作用,另一方面也关系着数据基础设施的技术架构和作用范围,这些未经探索的“节点结构”和“行动之网”为平台研究的发展提供了新的议题。


本文系简写版,参考文献从略,原文刊载于《国际新闻界》2022年第8期。

 封面图片来源于网络

本期执编/小韩


订阅信息


全国各地邮局均可订阅《国际新闻界》,国内邮发代号:82-849,欢迎您订阅!


您也可通过下方二维码或网址https://weidian.com/?userid=1185747182,进入国际新闻界微店,购买当期杂志和过刊。


您还可访问《国际新闻界》官方网站 http://cjjc.ruc.edu.cn/ ,免费获取往期pdf版本。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存