王楠 , 罗珺文 | 高校科研成果的非学术影响及其评估：是什么，为什么，怎样做？

Original 王楠 , 罗珺文华东师范大学学报教育科学版 2021-09-10

本期精彩

新刊速递 | 华东师范大学学报（教育科学版）2020年第4期目录

特稿

岳昌君 , 夏洁 , 邱文琪：2019年全国高校毕业生就业状况实证研究

“一带一路”教育

陈时见 , 王远 | 从“边境”到“跨境”：“一带一路”背景下跨境民族教育的转型发展

蔡文伯 , 闫佳丽 | “一带一路”沿线国家来华留学生与中国对外直接投资关系的实证研究

高等教育评价

林小英 , 薛颖 | 大学人事制度改革的宏观逻辑和教师学术工作的微观行动：审计文化与学术文化的较量

摘要：“非学术影响”评估是指科研成果对学术界以外的更宽泛的社会、经济、文化、公共政策、医疗、环境以及公民生活质量所产生的影响和推动作用。近年来，国际科研评估范式正在发生转型：由单纯地关注科研成果的学术影响转向兼顾其对外部社会辐射的更广泛的非学术影响。非学术影响评估在科学与社会的不断重构中逐步兴起，它遵循了知识生产的自身逻辑，更好地回应了公共投入的社会问责，同时有利于增强研究人员的社会责任意识。开展非学术影响评估的方法主要包括计量学（如计量经济学，替代计量学）、影响力调查（如问卷和访谈）以及影响力案例三种，它们各具特点，相互补充。在我国开展科研评估制度改革与创新的探索中，可考虑引入非学术影响评估，发挥其社会价值导向，推动研究成果产生多样的非学术影响，提升研究者的社会责任意识，重建良好的科研生态体系。

关键词：科研评估；评估范式转型；非学术影响评估；评估方法

作者简介：王楠，首都师范大学教育学院、首都教育发展协同创新中心副教授，管理学博士。

基金项目：北京市教育科学“十三五”规划2018年度重点课题“高校科研成果‘非学术影响’评估的国际比较研究”（BABA18040）

原文载于《华东师范大学学报（教科版）》2020年第四期

一、引言

二、什么是科研成果的“非学术影响”

三、为什么要开展科研成果的非学术影响评估

四、怎样开展科研成果的非学术影响评估

五、启示与思考

一、引言

上世纪末至本世纪初，伴随知识生产模式的转型和新公共管理运动的兴起，科学与社会之间的关系不断重构，时代对知识生产提出新的诉求：既要肩负知识创新的使命，也要兼顾其社会责任。这使各国都对不断增加的研发经费所带来的社会收益空前关注，同时也引发了对科研评估体系价值导向的反思。

对已有科研评估制度的梳理不难发现，以往的科研评估体系更多地发挥了学术导向功能，注重衡量科研成果的原创性和卓越性，但是对科学研究的社会价值关注不够，这不仅难以顺应知识生产模式转型的浪潮，而且容易造成学术系统的内封闭、自循环，学科发展的标准化、单一化，研究成果转化率较低、辐射范围较小等诸多问题。这些问题不仅不利于构建可持续发展的学术生态环境，还一度给社会和公众造成“公共科研投入回报率低”，“科学家的社会责任意识不足”等负面印象，诟病之声不断。基于此，世界各国学术界纷纷做出回应。2007年奥地利国家基金委联合欧洲基金委组织了名为“重新思考基础科学对社会和经济的影响力”论坛；2010年欧盟委员会提出“对科研的公共投资究竟给社会带来了怎样的收益”这一议题；美国评估协会也在2012年将协会年会主题定为“（社会）影响力”，掀起了各国学术界对科研的非学术影响及其评估框架的热议。

在这样的背景下，国际科研评估范式正在悄然发生转型：由单纯地关注科研成果的学术影响转向兼顾其外部非学术影响，更多地关注科研成果在学界以外对整个社会产生的辐射影响（impact）。世界不少国家和地区都开始对科研评价体系进行改革和创新，其共同点就是在评估体系中陆续增加了科研成果的“非学术影响”评估这一全新的维度，并且这一维度在评价指标体系中所占的比重不断增加，比如英国的“科研卓越框架”评估体系，荷兰的“标准化评估”体系等，都在2010年前后分别引入了这一新维度，并采用了不同于传统评估模式的新方法开展评估工作，期待通过引入“非学术影响”维度转变评估的价值导向，引导高校和研究机构更好地利用和转化科研成果，引导学界理解研究之于社会发展的重要意义，增强科研工作者的社会责任意识，进而促进研究工作在科学与社会的交互发展中发挥更重要的作用，为社会带来更多积极的改变与影响。这种转型与相应的实践探索凸显了科学研究服务社会的价值导向，也将对世界范围内的知识创新活动，国家层面的科研战略选择，高校和科研机构的学科发展带来一系列重要改变。因此，理解和把握非学术影响评估的国际前沿理论和实践经验，对我国高校在“双一流”背景下探索科研评估制度的改革与创新具有重要的现实意义。那么究竟何为科研成果的非学术影响？为什么各国在近十年中开始逐步重视并相继开展非学术影响评估？面对这一全新的评估维度，应采取何种方法有效开展评估？这是本研究要解决的关键问题。

二、什么是科研成果的“非学术影响”

科研成果的“影响”往往指科学研究成果带来的结果或其产生的多方面的效果。一般认为，科学研究会产生两方面的影响，一是“学术影响”，即研究成果在学术圈内，对某一（或多个）学科领域的知识生产和科学共同体发展所作出的学术贡献，我们通常所考量的学术论文数量、成果引用率、科学奖励等，就属于学术共同体对科研成果学术影响的评价指标。而科学研究所产生的“非学术影响”是指科研成果对学术界以外的更宽泛的社会、经济、文化、公共政策、医疗、环境以及公民生活质量所产生的影响、带来的改变和推动作用（Penfield et al，2014）。这个定义仍比较笼统，也远非共识，因而近年来，一些学者和政策研究者纷纷提出一系列的名词来指代科研的非学术影响，包括第三主流活动（third stream activities）（Molas-Gallart et al，2002），社会效益（societal benefits）或社会质量（societal quality）（Van & Rip，2000），知识的有用性（usefulness of knowledge）（Department of Education, Science and Training, 2005），公众价值观（public values）（Bozeman & Sarewitz，2001），知识转化（knowledge transfer）（Vugh & Ziegele，2011），社会相关性（societal relevance）（Drooge et al，2010）等。就这些名词的内涵而言，它们实际上都在关注公共资助的科研成果所产生的外部非学术影响。

与科研活动本身一样，科研成果的非学术影响也是复杂和多样的。根据成果面向的受众群体不同，非学术影响的表现维度也不尽相同，主要表现为经济影响、文化影响、环境影响和社会影响。其中，经济影响主要指科研成果对于扩充国家或地区的经济资本所做的贡献，比如新技术新产品所带来的收益增加，研发投入增加，就业岗位增加，劳动者的劳动生产率提高等。文化影响指科研成果对于增加国家文化资本所做的贡献，比如增强对自身文化与多元文化之间关系的理解，从而增进社会的文化保护与文化多样性。环境影响指对于增加国家的自然资本所做的贡献，比如开发和使用绿色能源和可回收利用技术，减少浪费与环境污染等。社会影响指科研成果对于增加国家社会资本所做的贡献，比如开辟解决社会问题的新路径，引发对社会问题的公共讨论，提升政策决策水平与能力等（Donovan，2008）。我们可以看出，在考量“科研成果会改变什么”和“谁会从科研成果中受益”（University of York，2015）等问题时，学术影响与非学术影响的立足点与关注点有很大不同。

同时，非学术影响还有一些不同于学术影响的特点。第一，“非学术影响”具有模糊性。虽然上文阐释了科研成果对社会所产生的影响包括很多具体的方面，但在下文我们要提到的评估实践中，上述影响的诸多层面往往互相重叠，难以区别开来。我们通常可以看到研究成果带来的影响混合了上述诸多方面，如提升了公民的生活质量，推进了社会的可持续发展，加速了人类文明进程，但是却很难将这些影响进行具体的区分。特别是经济方面的影响往往与其他几类影响之间是高度重合的，界限并不明显（Martínez & Gallar，2010）。比如，某一种新的药物治疗对健康有益，能大大缩短某些疾病的治愈时间，节省大量的医疗资源，其带来的回报不仅包括社会回报，也在很大程度上包括经济方面的回报（Salter & Martin，2011）。第二，“非学术影响”具有滞后性。科研的“非学术影响”往往不是在短期内能够呈现出来的，一般需要经历比较漫长的转化周期，最终转化的影响类型也很多样。一项科研成果的中期影响可能是形成新的合作网络、新的产品，而长期的回报有可能是提升了整个工业界的竞争实力。有相关数据显示，在心血管研究中，从拿到科研经费到最终产生健康回报，大约有17年的时间滞后（Buxton，2011）。第三，“非学术影响”具有偶然性。科研成果对社会的辐射影响有些是预期之内的，而有些是预期之外的，这种“预期之外”既包括产生影响的结果，影响辐射的地区，也包括影响辐射的受益群体。比如，在1990年代，人们普遍认为关于细胞凋亡的研究是非常具有原创性的高水平研究，但30年后却发现这项研究对人类健康没有可衡量的影响。相反的是，对不同种类的失禁垫的研究在当年绝不会被学术界认为是高质量的研究，却对社会产生了立竿见影的重要的影响力（Smith，2011）。另外，“非学术影响”的辐射范围往往也具有偶然性，并不局限于预期中的特定国家或地区，通常是全球性的。综上，科学研究的“非学术影响”所涵盖的领域是非常广泛的，除了对科学自身的贡献以外，科研对经济、文化、环境、社会的所有重要影响都涵盖其中。另外，由于“非学术影响”的上述特点，加之不同利益相关者对科研的兴趣和期待各不相同，几乎不可能对每一项具体的科研所能产生的非学术影响采用统一的衡量标准。因此，对其进行评估也有着很大的难度和不确定性（Bornmann，2013）。

三、为什么要开展科研成果的非学术影响评估

非学术影响评估兴起的动因是多方面的，既是知识生产模式转型的结果，也是大学和研究机构履行社会服务职能的必然选择。

(一) 回应知识生产模式的变革，遵循知识生产的自身逻辑

科研成果非学术影响评估的兴起与科学研究活动本身的变革密不可分，其顺应了知识生产模式转型的浪潮，遵循了知识生产的自身逻辑（武学超，2015）。

从科学社会学视角来看，近年来大学知识生产模式正在发生根本性变革，当下大学的知识生产正在从传统的“强调学科本位”和“追求高深学问”的知识生产模式1（Mode 1）走向“强调科研的跨学科本质”和“问题解决”的模式2（Mode 2）（Gibbons et al，1994, pp.4−6）。知识生产模式1主要指在传统的学科结构体系和学科逻辑下进行的知识生产，科学研究恪守学科本位，研究的价值导向是追求高深学问、创造知识的增长。大学及其内部的理论建设者是科学研究的合法主体，科研成果的质量主要依靠同行评价的方式来考量（Gibbons et al，1994, pp.7−11），而考量的主要维度则是成果的原创性和卓越性。

知识生产模式2则是一种新型的、以问题解决为导向的知识生产组织模式，强调在应用情境中进行知识生产，打破原有的学科边界，充分尊重科学研究的跨学科本质，同时容纳理论框架与实践模式两方面要素，兼顾大学的学术使命与社会责任（Gibbons et al，1994, p.36−39）。由于模式2下的知识生产追求使得工业界或者更广泛社会群体受益（Gibbons et al，1994, p.5），因此鼓励学术界与其他利益相关者群体开展合作与互动，强调大学、产业、政府和公民社会等多元主体对科学的协同治理。模式2 在追求科研的原创性和卓越性的同时，还需要保证科研成果对外部社会经济作出贡献，认为尽管是基础科学研究也必须考虑终端用户的需求（Bornmann，2013）。

在知识生产模式变革的背景下，对知识生产结果与影响的评估也随之发生了范式转型。模式1主导下，我们主要评估研究所产生的知识本身的价值，包括学术质量和学术影响，考察其卓越性和原创性，在模式2主导下，我们则要评估科研成果的社会价值，兼顾其对外部社会、经济、政治等多方面产生的非学术影响（Bornmann，2013）。这也是顺应高级知识经济社会对知识生产与创新的时代需求（武学超，2015）。

(二) 回应公共投入的社会问责，证明研发经费的社会收益

科研成果的非学术影响评估需要被用来展现和证明公共研发投入所带来的社会收益与社会价值，证明公共经费使用的合理性与合法性，并以此为依据为未来的经费投入提供必要的决策参考。

实际上，20世纪90年代以前，政策制定者始终相信公共研发投入会获得积极的社会收益与社会回报，他们认为“对科研任何形式的投入都将是对社会有利的”（Bush, 1945, p.11）。从小的方面讲，科研成果能够改善人们的衣、食、住、行，人们的工作方式和生活方式；从大的方面讲，科研成果甚至能够影响人类生命的长度和质量（Burke et al，1985）。因此很多国家都不遗余力地提高研发强度（研发投入占GDP的百分比），并怀抱“科技改变生活”的美好愿景。然而，从80年代末开始，一些国家相继出现的财政赤字迫使科研机构开始以同行评议和绩效指标评估等方式对科研成果的质量和非学术影响加以考察和问责，发现此前对“科研成果必将产生社会收益”的主动信任存在一定的风险，人们不能再盲目相信任何科学研究都将自动给社会带来福祉，也许在顶尖期刊上发表高水平论文能够推动学科的发展，但却未必真正产生广泛的社会收益。当科研成果转化成可消费的产品或服务时，社会大众才能更直接、更迅速地从科研成果中获益。

欧盟委员会于2010年提出“对科研的公共投资究竟给社会带来了怎样的收益”这一议题，引发了各国政府的广泛关注和热切回应。近年来，大多数OECD国家都将GDP的2%—3%投入到了研发活动中，政府和公众都迫切希望获得科研切实对社会有利的证据（Martin，2011）。由此，科学研究成果的非学术影响也逐步被纳入到科研评估的考察范围中来，成为了评价的重要维度。非学术影响评估被认为是强有力的武器，它为科学研究带来的社会价值提供了必要的证据（Donova，2010），并能够更好地协助政府监测、管理和协调公共经费，以便将经费用于最迫切和希望产生影响的社会领域。

(三) 引导研究人员进行科学反思，增强其社会责任意识

非学术影响评估为知识的创造者和使用者搭建了一种常态化的协同与互动机制，有利于加深彼此的相互理解与价值认同，引导和启发研究人员进行科学反思，强化研究人员的社会责任意识。

研究人员在以往的科研活动中对研究带来的社会影响关注不够，其原因之一就在于现行的科研评估制度主要发挥着较强的学术引导性，引导研究者坚持供给导向，而忽略了终端用户的需求，导致大部分学者都把追求以文章发表为代表的学术影响作为首要任务，而并未充分意识到科研工作对于推动社会发展的责任和作用（Benneworth，2017）。新的知识生产模式为科学与社会之间的关系带来了新变化，强调多元主体对科学的协同治理。由此，科学与社会正在发生双向影响与彼此重构。如我们所见，当下社会部门越来越广泛地参与着科研活动的全过程，包括对于情境化研究问题的确定，对于研究优先次序的选择，对于研究的绩效评估，对于成果的阐释和传播等等。科学研究不再局限于科学共同体内部，而是更大范围内、多元主体叠加多种因素相互作用的结果。“知识生产希望对工业、政府或者更广泛的社会中的一些群体有用，而这种需求从知识生产的一开始就一直存在，始终面临不断的谈判、协商，除非而且直到各个参与者的利益都被兼顾为止”（吉本斯, 2011,第4页）。

在这样的背景下，非学术影响评估将更好地发挥社会价值引领作用，引导科研工作者关注研究的社会影响，关照不同利益群体的价值偏好，并与其进行价值协商与价值共建，而由此带来的彼此理解的深化，也将反过来影响科学家思考究竟什么是值得开展的研究，究竟哪些社会群体和用户可以从研究中受益。这将使研究者对社会影响更为敏感，使科研工作的社会价值目标更加明确，进而间接影响科学研究的结构与结果。换句话说，开展非学术影响评估的目标不仅在于得到评估结果本身，更在于让知识的创造者和使用者之间建立起常态化的互动机制，强化研究者的社会责任意识。

四、怎样开展科研成果的非学术影响评估

近二三十年来，国际上对于科研成果的非学术影响评估开展了广泛而深入的探讨，但由于非学术影响的模糊性、滞后性和偶然性，给评估带来了一定的难度。目前尚未形成学界公认的、被广泛推广的评估方法。澳大利亚、英国、荷兰等国家都进行了一些实践探索，为我们提供了一些可资借鉴的经验。总体而言，当前主流的评估方法包括如下三种：

(一) 计量学：提供发生非学术影响的证据

在科研成果的非学术影响评估中，各种计量学方法被广泛采用。大家普遍认为，虽然计量学具有一定的局限性，但可以为非学术影响的发生及程度提供一些有力的证据。其中，传统的用于衡量学术影响的科学计量学方法也被借鉴和沿用，评估者可以根据特定情境来设计和使用计量指标，以考察研究成果产生的外部社会经济影响。这些指标相较学术影响评估的指标而言，更加灵活多样，比如包括：科研成果带来的商业收入和利润；用科研成果注册的专利数量；因开展科研活动而创造的就业岗位，培养的博士生和博士后数量；科技展览会的来访者数量等。如果在考量指标的同时关注指标的特定情境，可以更好地理解影响力的表现及其程度。

此外，已经发展得比较成熟的计量经济学方法也被大量用于衡量科研成果在经济维度的影响，即考量科学进步对经济增长的贡献（Salter & Martin，2010）。比如，有学者通过计量经济学模型发现英国1975年至1992年间，对心血管疾病的公立研发投入带来的国民健康和GDP的内部收益率约为39%。也就是说，每1英镑投入在心血管疾病的研究经费都带来了之后每年0.39英镑的收益（ Health Economics Research Group，Office of Health Economics，RAND Europe，2008）。美国国家健康研究所（NIH）的数据分析显示，公共基础科研每1%的增长都最终带来NME类新药（美国食品医药管理局对新药的一个重要分类）1.8%的增长（Toole，2011）。显然，运用计量经济学测度科研的非学术影响存在一定的学科和领域差异，有些行业（如计算机）比其他行业（如金属制品）从科研成果中获利更多，有些学科（如医药）比其他学科（如数学）在可衡量的社会价值和贡献方面更为显著。而与其他维度（如文化）相比，科研对经济增长的贡献显然更容易衡量，因此计量经济学也更广泛地被使用。

近年来科研成果的网络化传播催生了应用“替代计量学（altmetrics）”来衡量和监测非学术影响的趋势，特别是针对社会和文化这些不太容易量化的维度。随着网络信息技术日趋成熟，科学传播的途径已经不再局限于传统的学术期刊和书籍。政府报告、科学博客、报纸杂志等纷纷成为科研成果传播和推广的舞台。年轻学者们也更倾向于借助社交媒体和网络工具来分享适合大众传播的科研成果，交流观点，传播思想，进行在线互动和协作等。这些都可以通过替代计量学来进行追踪、记录、分析，进而测度科研成果向外辐射的范围与程度（刘春丽，2016）。比如，替代计量学指标可以反映研究结论在维基百科或百度百科、网络数据库、博客、社交媒体等网络平台上的被引用和被讨论次数，还可以追踪特定的受众人群，以及他们对研究成果的态度等。学者普遍认为，传统的计量学指标，比如影响因子是基于传播速度较慢的、严格正式的学术交流体系的，而创新的科学思想更多是在零散的、快速传播的、非正式交流过程中产生的。因此，基于网络平台和社交媒体对科研成果的广泛传播和使用，替代计量学为科研评价体系带来新的视角，其开放地记录了科学传播的全过程，允许考察科学家们在多个平台进行知识沟通、创造、再利用的行为踪迹，有利于更好地记录和反映科研成果对社会大众产生的非学术影响（Bornmann，2014）。当然，这一方法的客观性和操作性仍在探索与讨论之中。

采用计量学方法评估科研成果的非学术影响具有一些明显的优势，比如，延续了传统的学术影响评估的方式，接受程度较高；评估方法较为简单，过程可操作性强，结果相对客观且具有横向可比性；同时，这种方法的操作成本较低。但是，使用标准化计量工具也存在一定的风险：第一，定量指标可为非学术影响的发生提供相应的证据，但无法描述影响力的全貌，也无法对影响产生的因果进行联结和综合分析。第二，我们容易把注意力集中于可见的、相对容易衡量的影响上，比如经济贡献等，容易忽视那些创新研究所传递的潜在的、长期的社会价值。第三，影响力的程度容易被货币化或被刻意简单化。

(二) 影响力调查：收集利益相关者的观点表达

我们需要将研究成果的非学术影响置于具体的情境中加以评价和分析，因此，在定量指标呈现出非学术影响的结果后，我们还需要回答由此衍生出的“如何发生”和“那会怎样”等定性问题。为了呈现非学术影响的全貌，可以采用影响力调查的方式，通过问卷或访谈来收集特定的科研成果的利益相关者和终端用户的反馈，从而比较详细地、有针对性地呈现某个具体的研究成果对于特定人群所产生的影响。

影响力调查能够涉及的维度远超计量学中包含的有限指标，运用起来也比较有针对性，既可以针对某项具体的科学研究开展利益相关者调查，也可以针对宏观的科学研究政策开展民意调查。举例而言，20世纪90年代初，Mansfield通过问卷调查了美国76家公司的研发经理，发现他们所在的公司在过去十年里有平均10%的产品或生产线是完全依靠科学研究的成果来支持的，如果相关的科研工作停滞，这10%的产品或生产线就得全部关停。随后，在90年代末期，他又对其中的70家企业进行了追踪调查，发现这个比例上升到了15%（产品）和11%（生产线）（Mansfield，1991）。该调查反映了科学研究活动对企业贡献的附加值。Beise和Stahl也沿用了这个方法，调查了德国2300家企业，发现在1993年至1995年期间，有将近十分之一的创新企业是依靠科技成果而建立和发展起来的（Beise & Stahl，1999）。这些调查通过收集研究成果的终端用户的反馈，为科学研究带来的社会影响提供了可资参考的证明。

影响力调查的优势在于能够获取丰富的第一手资料。无论是针对某项具体的科学技术产品，还是针对宏观的科技政策，这些直接面向利益相关者群体得到的第一手资料都是不可替代的、直观且珍贵的观点。但也正因为这些第一手资料的丰富性和独特性，造成评估结果在可量化和可比性方面存在一定的不足。同时，通过开展调查进行非学术影响评估需要付出较高的成本。从收集、捕捉相关信息，到形成评估结论，再到评估结果的呈现与表达，每一个环节都是一件耗时耗力的工作，特别是当利益相关者群体比较分散的时候，就更增加了评估者的工作难度。同时，要想完整地搜集、记录、整理、分析调查资料，并很好地呈现评估的结果，需要评估人员有很好的观察能力、沟通能力、桌面研究能力等综合能力。

(三) 影响力案例：讲述特定情境下的影响力故事

影响力案例是近年来接受度较高的非学术影响评估方法，已经被澳大利亚、英国和荷兰等国家用于高校和科研机构的评估工作中。影响力案例通常由被评估单位的研究人员面向评估者撰写，案例可以从特定的视角出发，将研究工作置于具体的情境中，通过描述科研成果服务社会的相关事件和活动，来呈现研究所带来的社会价值的内涵、表现形式和实现路径。一个完整的影响力案例通常能够融合计量与叙事两种方法，使数据信息和观点表达相互印证，像讲故事一样对影响力的发生与辐射进行详细、生动的描述。

澳大利亚的“科研质量框架”（Research Quality Framework，RQF）是全球首个尝试全面捕捉跨学科研究的社会影响的评估框架，其主要采用了“影响力案例”的方法。被评估单位的研究人员通过撰写影响力案例，提供必要的数据支持和叙事材料，来描述和论证其研究成果为经济、社会、环境、文化等方面做出的贡献（Duryea et al，2007）。同行评议专家将根据影响力案例的文本判断其研究带来的社会价值。

英国全新的“科研卓越框架”（Research Excellence Framework, REF）评估体系同样采用了“影响力案例”方法，要求被评估单元通过4页以内、包含一些特定维度的结构化叙事来描述研究成果对社会产生的辐射影响，同时提供被评估单元为推进科研成果产生非学术影响所采取的战略措施。评估者将根据案例描述，从社会影响辐射范围及影响的重要意义两个方面来进行评估（王楠，罗珺文，2017）。

荷兰近年来强调“特定情境下的科研评估”理念，着眼于捕捉和分析科研进程中研究者与利益相关者群体如何通过高效互动来促进科研的传播和应用，从而实现“价值创造（Valorisation）”，即通过知识生产创造广泛的社会价值（De et al，2014）。2015年，荷兰在其新版《标准化评估指南（2015—2021）》（Standard Evaluation Protocol（2015—2021），SEP 2015）框架中首次将科研成果的“社会相关度”列为评估的三大指标之一，要求被评估单位选择有代表性的影响力案例来描述和呈现科研工作所带来的社会价值（KNAW，VSNU，NWO，2014）。

如上，一个成熟的影响力案例既可以呈现定量数据，也可以描绘特定情境下的叙事，是一种比较理想的、多维度展现科研成果非学术影响的方法。其优势在于能够保留和区分不同学科研究成果的特点和特定的情境视角，展现从自然科学到人文学科等领域中各种类型的研究为社会带来的多元影响，特别是对于缺乏定量数据支持的学科（如艺术、哲学等），同样允许研究者通过讲述完整的“故事”来呈现研究带来的社会价值。但是，开展影响力案例评估同样面临诸多考验。首先，评估单位的研究人员所提供的影响力案例有可能掺杂了一定的主观因素，这将对评估者的客观评价产生一些不利的影响。第二，不同的研究人员撰写的案例从体例到术语存在较大差异，这增加了横向比较和评估的难度。尽管已经有学术共同体意识到了这一问题，并已着手汇集和编撰用于描述影响力的标准化术语字典，以用作案例撰写的参考，但要得到大范围的认可和推广尚需时日（Baker et al，2017）。第三，对影响力的评估将受到案例本身撰写水平的限制。显然，擅长讲故事、写文章的项目组或者能够承受额外费用聘请专业人士来撰写案例的项目组更有可能获得较好的评估结果，这将使评估结果产生偏差。最后，开展案例研究的成本也是比较高的，包括案例的收集、资料的整理、文本的撰写等，都将花费研究者大量的时间和精力。对于评估者而言，案例的阅读、整理和实证资料的考证也存在一定的难度。

五、启示与思考

综上，在科研评估范式转型背景下，不同国家和地区都陆续在“非学术影响”评估的实践领域进行了一些创新与探索，这对构建良好的科研生态体系、增强研究者的社会责任产生了积极的推动，其中不乏值得思考与借鉴之处。

(一) 发挥评估的社会价值导向，构建良好的科研生态体系

如前所述，近年来国际科研评估范式由单纯关注科研成果的学术影响转向兼顾其非学术影响，这一方面与知识生产模式发生的根本性变革遥相呼应，另一方面也是对已有评估范式之沉疴痼疾的突破。传统的科研评估范式更多地发挥了学术价值导向，关注科研成果在科学共同体内部产生的学术影响，却忽视了科研活动对外部社会的辐射影响，难免造成学术系统封闭僵化、自说自话的困境。科学研究的根本目的不仅在于知识创新，更在于利用知识创新寻求解决社会问题的途径，为人类生产和生活方式的改变，人类文化和生存环境的改善等作出积极贡献。然而有时候我们“走的太远”却忘记了“为何出发”。就我国的现实情况而言，现行的科研评估制度和人才考核体系中，“唯论文、唯职称、唯学历、唯奖项”（以下简称“四唯”）等现象仍然严重，这些无不是由于价值偏离而导致的评价异化。日前，科技部、教育部、人力资源社会保障部、中科院、工程院联合发布了《关于开展清理“唯论文、唯职称、唯学历、唯奖项”专项行动的通知》，指出要克服科研评价中存在的“四唯”倾向，对“四唯”问题集中清理，注重研究成果的质量、贡献和影响。然而强制不如自治，治标更需治本。我们可以考虑通过在评估体系中引入“非学术影响”评估来强化研究的外部社会责任，从根本上转变僵化陈旧的评价导向，更有效地发挥评估的激励作用，引导研究成果的学术贡献与非学术贡献形成相互协调的动态平衡，提升学术系统的活力和多样性，构建良好的科研生态体系。

(二) 超越对评估结果的过度关注，聚焦研究者社会责任意识的提升

进行非学术影响力评估的目的不光在于要得到一个研究者做得“好或不好”的价值判断结果，更重要的是，要以非学术影响评估作为一个契机和抓手，潜移默化地让研究者开始关注自身的研究工作所能带来的社会价值，进而提升研究者的社会责任意识，同时让知识的创造者和使用者之间建立起一种常态化的协同与互动机制。科学研究从来都不是单纯的知识创造过程，它同时也是社会利益反复平衡和博弈的过程。因此，科学家肩负学术使命的同时更肩负着重大的社会责任，后者甚至远重于前者。日前，学界对这一话题的讨论在我国诞生世界首例基因编辑婴儿之后再次达到了高潮。实际上，促进科研工作者建立与其在学术领域的卓越追求相匹配的社会责任意识至关重要。我们也必须意识到，这种推动力不应是自上而下对学者提出的强制性要求，更要建立自下而上的，有利于引导科研工作者自觉树立责任意识的机制。非学术影响评估不失为一个有力的抓手。例如，在英国的科研卓越框架（REF）中正式纳入“非学术影响”评估维度后，很多高校已经正式为博士研究生开设了关于非学术影响案例的设计与撰写的专业必修课程，也就是说未来英国的研究人员不仅要有卓越的研究成果，同样要在研究过程中充分关注、积极思考以及学会阐释研究成果之于社会的有用性，而这种关注与思考正是通过“非学术影响”评估的引导而发生的。

(三) 选择开放、多元的评估方法，鼓励真实、多样的非学术影响

科研成果非学术影响产生的路径与学术影响完全不同，具有较强的模糊性、滞后性和不确定性，其影响也必然辐射更广泛的地区、人群和社会领域。已有的学术影响评估的思路与方法比较局限，很难有效地捕捉和呈现非学术影响发生的路径与效果。要保证评估不偏离其初衷同时发挥积极的导向作用，必须在方法上进行尝试与创新，以开放、多元为基调选择适恰的评估方法，从而鼓励真实、多样的非学术影响发生。比如，近年来伴随网络社交媒体的兴盛和开放知识运动的蔓延，替代计量指标有效地补充了传统引文评价指标的不足，从多个角度反映和评价科研成果的社会影响（刘烜贞，湛乐，2017），其在“名”与“实”上都逐步取代了传统的文献计量方法，也逐渐被一些高校所认可和采纳。如，浙江大学在2017年9月发布了《优秀网络文化成果认定实施办法（试行）》，拟将在报刊、电视、互联网上刊发或播报的，具有广泛网络传播的原创文章、影音、动漫等优秀网络文化成果纳入学校科研成果统计、各类晋升评聘和评奖评优范围，在评估实践中将“网文”纳入了科研评价体系（刘爱生，2018），赋予了研究成果非学术影响的合法性地位。再如，当前被最广泛采纳和应用的影响力案例方法，允许研究者以自由、开放的方式描述不同情境下的影响力“故事”，更多地关注真实情景中科学发展和科技进步为社会作出的积极贡献，使得评估超越了对评估方法技术理性的推崇，更好地回归了“影响”本身。上述这些评估方法都充分考虑和尊重了学科差异和研究活动的多样性，不仅有利于在评估中更有效地捕捉和评价影响发生的路径和效果，并且有利于反向促进科研活动的多样化和学科发展的多样化，不失为对非学术影响评估的探索，值得借鉴和尝试。

最后，有必要强调，当下开展非学术影响评估的相关研究与实践对于我国高校科研评估制度改革具有重要的现实意义，但是科研成果的学术影响与非学术影响之间是一种动态、开放的生态关系，要在具体学科和评估实践中加以考量。因此，我们也需要非常审慎地看待这一新兴的评估维度，并尽量采用适恰的方法来规避有可能对科研活动产生负面效应的风险，以避免从一个极端走向另一个极端。

参考文献

刘爱生. (2018). 国外学术评价体系中的“网文”: 兴起、行动与挑战. 清华大学教育研究, 39(05), 90-98.

刘春丽. (2016). Altmetrics指标在科研评价与管理方面的应用. 科学学与科学技术管理, 37(06), 13-21.

刘烜贞, 湛乐. (2017). 替代计量指标评价科研成果社会影响的研究. 情报探索, 2017(10), 35-38. DOI:10.3969/j.issn.1005-8095.2017.10.007

吉本斯. (2011). 知识生产的新模式当代社会科学与研究的动力学(陈洪捷, 沈文钦等译). 北京: 北京大学出版社.

王楠, 罗珺文. (2017). 英国高校“科研卓越框架”的改革与创新. 中国行政管理, 2017(10), 141-145. DOI:10.3782/j.issn.1006-0863.2017.10.24

武学超. (2015). 大学科研非学术影响评价及其学术逻辑. 中国高教研究, 2015(11), 23-28.

Baker, D., Clements, A., Grout, C., Kerridge, S., McCutcheon, V., Newnham, H.. (2017). CASRAI-UK: Using the CASRAI Approach to Develop Standards for Communicating and Sharing Research Information in the UK, 13th International Conference on Current Research Information Systems, CRIS2016. Procedia Computer Science, (106), 100-103.

Beise, M., & Stahl, H.. (1999). Public research and industrial innovations in Germany. Research Policy, 28(4), 397-422. DOI:10.1016/S0048-7333(98)00126-7

Benneworth, P. (2017). We need better understanding of 'good' research impacts. Retrieved from https://www.ideas-idees.ca/blog/we-need-better-understanding-good-research-impacts

Bornmann, L.. (2014). Do altmetrics point to the broader impact of research? An overview of benefits and disadvantages of altmetrics. Journal of informetrics, 8(4), 895-903. DOI:10.1016/j.joi.2014.09.005

Bornmann, L.. (2013). What is societal impact of research and how can it be assessed? A literature survey. Journal of The American Society of Information and Technology, 64(2), 217-233. DOI:10.1002/asi.22803

Bozeman, B., & Sarewitz, D.. (2001). Public value mapping and science policy evaluation. Minerva, 49(1), 1-23.

Burke, J., Bergman, J., & Asimov, L. (1985). The Impact of Science on Society. Washington DC: National Aeronautics and Space Administration. In Bornmann, L. (2013). What is societal impact of research and how can it be assessed? A literature survey. Journal of The American Society of Information and Technology, 64(2), 217−233.

Bush, V. (1945). Science the Endless Frontier. Washington DC: United States Government Printing Office.

Buxton, M.. (2011). The payback of "Payback": Challenges in assessing research impact. Research Evaluation, 20(3), 259-260. DOI:10.3152/095820211X13118583635837

De, J. S., Barker, K., Cox, D., Sveinsdottir, T., & Van, D. B. P.. (2014). Understanding societal impact through productive interactions: ICT research as a case. Research Evaluation, 23(2), 89-102. DOI:10.1093/reseval/rvu001

Department of Education, Science and Training. (2005). Research quality framework: Assessing the quality and impact of research in Australia. (Issue paper). Canberra: Commonwealth of Australia.

Donovan C. (2008). The Australian Research Quality Framework: A live experiment in capturing the social, economic, environment, and cultural returns of publicly funded research. New Directions for Evaluation, 2008(118), 47-60. DOI:10.1002/ev.260

Donova, C. (2010). Impact is a Strong Weapon for Making an Evidence-Based Case Study for Enhanced Research Support but a State-of-the-Art Approach to Measurement is Needed. Retrieved from: http://blogs.lse.ac.uk/impact of social sciences/tag/claire-donovan.

Drooge, L et al. (2010). Evaluating the societal relevance of academic research: A guide. . Retrieved from: http://repository.tudelft.nl/assets/uuid:8fa07276-cf52-41f3-aa70.

Duryea, M., Hochman, M., & Parfitt, A.. (2007). Measuring the impact of Reasearch. Research Global, 2007(27), 8-9.

Gibbons, M et al. (1994). The new production of knowledge: The dynamics of science and research in contemporary societies. London: Sage.

Health Economics Research Group, Office of Health Economics, RAND Europe. (2008). Medical research: What’s it worth? Estimating the economic benefits from medical research in the UK. Evaluation Forum. London: Office of Health Economics.

KNAW, VSNU, NWO. (2014). Standard Evaluation Protocol2015-2021, Protocol for Research Assessment in the Netherlands (Amended Version, 2016). Amsterdam.

Martínez, E. C., Gallar, J. M. (2010). Social Impact Assessment Methods for Research and Funding Instruments Through the Study of Productive Interactions(SIAMPI). Retrieved from: http://www.siampi.eu/Content/SIAMPI/Report%20SIAMPI%20Workshop.pdf.

Mansfield, E.. (1991). Academic research and industrial innovation. Research Policy, 20(1), 1-12. DOI:10.1016/0048-7333(91)90080-A

Martin, B. R.. (2011). The Research Excellence Framework and the 'impact agenda': Are we creating a Frankenstein monster?. Research Evaluation, 20(3), 247-254. DOI:10.3152/095820211X13118583635693

Meulen, B., Rip, A.. (2000). Evaluation of societal quality of public sector research in the Netherlands. Research Evaluation, 9(1), 11-25. DOI:10.3152/147154400781777449

Molas-Gallart, J., Salter, A., Patel, P., Scott, A., & Duran, X.. (2002). Measuring Third Stream Activities: Final Report to the Russel Group of Universities. SPRU-Science and Technoly Policy Research, 2002(85).

Penfield, T et al.. (2014). Assessment, evaluations, and definitions of research impact: a review. Research Evaluation, (23), 21-32.

Salter, A. J., & Martin, B. R.. (2011). The economic benefits of publicly funded basic research: A critical review. Research Policy, 30(3), 509-532.

Smith, R.. (2011). Measuring the social impact of research. British Medical Journal, 3237312, 528.

Toole, A. A.. (2011). The impact of public basic research on industrial innovation: Evidence from the pharmaceutical industry. Research Policy, 41(1), 1-12.

University of York. (2015). What is research impact?. Retrieved from https://www.york.ac.uk/staff/research/research-impact/impact-definition.

Van Vught, F. A., & Ziegele, F. (2011). U-Multirank: design and testing the feasability of a multidimensional global university ranking: Final report. Brussels: Consortium for Higher Education and Research Performance Assessment.

●往期回顾 ●

新刊速递 | 华东师范大学学报（教育科学版）2020年第3期目录

特稿

朱永新 , [美]约翰 •库奇：技术如何释放终身学习者的潜能？——朱永新与约翰•库奇关于未来教育与学习升级的对话

基本理论与基本问题

[美] 林逸梅：期待其他多重世界，赋我们自身以生机：向比较教育学发出的一份邀请
朱旭东：论教室文化的构建刘坚等：高中生睡眠时间与高学业成绩的理想匹配模式探究及预警

学习科学

徐光涛等：近二十年学习科学领域的研究脉络与发展趋势——对《人是如何学习的》系列报告的文本分析唐一鹏等：如何提升中小学生的学业成绩？——基于学习策略与教学策略改进的视角白倩等 | 重识与重估：皮亚杰发生建构论及其视野中的学习理论农村教育赵锦等 | 教育精准扶贫：中国农村学生近视问题研究及防控政策建议