通知公告

	关于做好2024年江苏省高等教育学会《江苏高教》专项... 08月05日
	关于组织申报2024年度省教育科学规划课题的通知 06月20日
	关于做好中国高等教育学会“2024年度高等教育科学研... 05月25日
	关于组织申报2024年度国家社科基金教育学重大项目暨... 05月07日
	关于组织申报2024年度校高教研究课题的通知 04月18日
	关于转发《2022年度江苏省教育科学规划战略性与政策... 11月04日
	关于组织申报2022年度省教育科学规划课题的通知 11月04日
	关于组织申报2022年度校高教研究课题的通知 05月31日

当前位置: 首页 >> 学术前沿 >> 理论研究 >> 正文

量化评估与大学发展

2020-12-30 王建华点击：[]

摘要：作为当前大学治理的重要政策工具，评估日益成为影响大学发展的“指挥棒”。在指标主义和测量主义交互作用下，以排名为代表的量化评估愈来愈“精确化”，但大学发展的路却越走越窄，甚至有误入歧途的风险。作为对即将来临的后工业社会的积极应对，建设世界一流大学至关重要。在走向世界一流的过程中，大学需要避免评估主义陷阱。量化评估结果或许可以作为诊断大学发展问题的参考，但绝不应成为判断大学优劣的唯一标准。判断一所大学是否世界一流的标准应是其促进经济社会发展和人的发展的综合实力，而不是排行榜上的排名。

关键词：大学评估;量化评估;大学排名;大学发展;一流大学

“评估”是人理性的重要组成部分。人世间任何事物都难逃脱人的理性“计算”或直觉“判断”，无论基于理性的“计算”还是基于直觉的判断都是一种“评估”。自大学诞生以来，对于大学的评估就以不同形式存在，但试图将大学评估结果加以“量化”或“精确化”，却是我们时代独特的产物。历史上对大学好坏的评价大多依赖分散、相互独立的“专家意见”，经过时间的沉淀，逐渐形成所谓的“声誉”。声誉好的大学就是好大学。所谓“评估”往往只有整体的判断，没有具体的标准，也没有一级二级指标，更不可能有基于测量得分的排名。在某种意义上，大学与大学之间基于教育和研究声誉而形成的等级秩序是长时间演化的结果，而非依据某些明确标准人为塑造的。对大学以及大学人来说，“人们各自采取的行动往往会产生一种秩序———尽管这种秩序是未意图的和未预见的，但是它却被证明是人们实现他们为之努力的各自目标所不可或缺的”^[¹^]。相比之下，我们时代更加相信“客观的测量”以及具体排名。在排行榜上，大学的好坏完全与指标统计得分的高低相对应。部分排行榜在量化排名过程中即便引入了同行评价，专家的主观意见也必须量化为客观分数。最终，原本极其复杂乃至难以实施的大学评估变为一种极其“简化”或“简单化”的数字算法。那些擅长设计和操纵指标体系的人凭借可以快速处理大数据的计算软件，取代了深谙大学发展原理以及精通诸学科高深知识的人，成为大学评估的专家。结果就是“评价从一种需要专业知识与技能的实践行为转变为一种自动化的机械操作”^[²^]。究其原因，一方面，大学教育水平和科研水平都是整体性的存在，难以测量，更不可能精确地测量；另一方面，受时代精神的影响以及政治思潮、政策环境、经济社会发展趋向的左右，对大学的评估和绩效评价又势在必行。虽然理论上大学评估的复杂性远非人的理性可以完全掌控，但为满足现实的需要，人的有限理性可对评估对象作出种种“变通”。最终由于对现实需要的满足而非理性的有限被置于首要地位，评估指标体系的合理性以及测量方法的科学性等问题往往被有意或无意地遮蔽了。换言之，受诸多内外部因素的影响，在高等教育改革和发展实践中“量化”评估本身成了评估目的，至于量化结果的有效性、科学性以及非计划性后果往往少有人关注。即便偶有关注，通常也认为政府和社会对大学的量化评估和绩效评价具有现实的必要性和合理性，在更合适的政策工具出现之前，最多只能通过“元评估”对现有评估进行改进，而不可能不进行量化评估。

一、大学量化评估的内部动因

当前大学评估之所以趋向以排名为标志的“精确化”，有多种原因。首先是对测量的迷思。受自然科学研究范式影响，很多研究者认为只要在统计方法上作出改进或变通，大学评估就可以像其他事务一样被精确地测量。其次是指标主义“暴政”。基于对测量的迷思，同时受文献计量学和循证实践的影响，很多研究者认为只要能设计一套或尽可能多套指标体系，就可以实现基于证据的大学评估。再次就是排名成为一种高等教育管理时尚和大学治理的政策工具。由于信息不对称，作为消费者的公众很难判断高校的质量，大学排名作为一种“相对价值”，较抽象的教育质量更加简明易懂。^[³^]面对政府问责以及绩效评价压力，排名不断提升自然而然成为大学回应政府和社会关注的最佳手段。最终测量、指标与排名相互强化，使大学评估尤其是评估结果的呈现愈来愈“精确化”；与之相应，评估对于大学优劣的判断也越来越“武断”。事实上，量化评估的科学基础主要是统计学，而统计学处理数据有两个重要的方法论原则，“第一，化复杂为简单；第二，有意把它所计算的个别要素看成是毫无系统联系的孤立要素予以对待”^[¹^]。作为专业组织和社会制度环境的一部分，无论是大学的教育水平还是科研水平都无法“化复杂为简单”，更无法在实质上将系统中紧密联系的各要素相互孤立开来。至少当前社会科学还没有发达到可对大学办学水平进行科学评估和精确测量的程度。

然而在量化评估中一直有种观念认为，自然界那么复杂都可以被测量，并基于测量发现规律，大学难道比自然界更复杂吗？大学和自然界本质上是两种完全不同的复杂系统，大学评估对象的复杂性与自然界的复杂完全不同。“各种不同的领域之间实际上存在着很重要的区别。我们不应当在社会科学各领域中不经思考就轻易地接受那种被自然科学家视作是他们可以泰然受之的必然的趋势。”^[¹^]相较而言，自然界的复杂是客观的、无机的、有限的，只要研究方法和技术不断改进，这种复杂性完全可以化繁为简。但大学评估对象的复杂性则是人为的、有机的、无限的，无论采取何种先进的方法和技术，都无法将其转变为一个可以测量的简单规律。在大学这样一个人为的但又不是人理性可完全设计或控制的系统里，自然科学方法并不具有普遍适应性，有时甚至完全不适用。目前，“即便是最有影响力的排名所解决的仅是小部分研究型大学以及大量学术成果和衍生品的测量问题”^[⁶^]。如果我们忽视大学评估对象的复杂性和特殊性，在指标主义意识形态控制下，量化评估不仅误解了大学教育的本质，还会把大学发展看得过于简单。结果就是，所谓的指标一旦作为指标使用，立即就会面临失效的风险。道理很简单，对于人类社会事务，“任何指标一旦创建和应用，该指标就会不断增长，因为指标吸引了我们的注意力”^[²^]。最终依据这些指标进行的测量以及基于测量结果给出的排名，提供的只是一种模拟或虚拟的信息，甚至可能是错误的信息，根本无法准确反映大学的真实情况，更不要说鉴别大学优劣。穆勒曾说：“有些事物可以测量，有些事物值得测量。但能被测量的东西，不见得总是值得测量；得到测量的东西，跟我们真正想知道的东西，有可能毫无关系。被测量的东西，有可能让我们从真正在乎的事情上分散精力。测量给我们带来的或许是扭曲的知识———看似可靠，实则具有欺骗性的知识。”^[⁸^]大学量化评估的困境也正在于此。大学里的有些活动可测量也值得测量，但能被测量的并非总值得测量，值得测量的也并非总可以测量。所谓量化评估只测量了可以测量的，而忽略了那些至关重要但不可测量的东西。面对大学评估的复杂性，我们必须摒弃对测量的迷思，认为一定可以找到完美的方法对大学进行精确测量，实是陷入了一个极大的认识误区。自然科学领域用来发现真理的测量与统计工具在大学评估中并不具有普遍适用性，且会滋长我们对数据和排名的迷信。

作为大学评估中精确测量的典型代表，排名原本是大学之外的第三方机构尤其是媒体对大学的“评估”。客观上这些机构的优势是“传播力”而不是“科学性”。长期以来，各类媒体上发布的大学排名和娱乐新闻一样，主要目的是吸引公众的注意力，从而提升杂志或报纸的销量；排名结果并不被大学、政府和社会所重视，也很少有严肃的高等教育研究者关注其指标设计是否合理和有效。但20世纪末尤其是迈入21世纪以来，随着一流大学建设运动席卷全球（迄今为止，全球有30个国家或地区已出台涵盖世界一流大学重点建设的60余项计划，遍及欧洲、美洲、亚洲和大洋洲，既有发达国家也有新兴经济体与发展中国家或地区^[⁹^]），加之信息传播的加速，大学排名受到了广泛关注。一些主要的大学排行榜甚至成为很多国家制定高等教育政策和发展战略的重要参考。专业的高等教育研究者和研究机构也开始积极介入大学评估和排名研究，并发布各类大学排行榜、学科排行榜。专业的高等教育研究者和研究机构很清楚大学量化评估和排名的难度，按照学术逻辑，无论哪个排行榜都经不起认真推敲。尽管如此，为了保住评估专家的身份，学术界还是卷入了基于测量的大学评估和排名。“只要公众期望过多，那么就总会有人假装———也许是真诚地以为———他们能够在满足公众需要的方面做出远远大于他们实际上能够做出的贡献。”^[¹^]学术界的介入原本是为了增强高等教育研究的话语权，提升大学评估和排名的科学性，结果却事与愿违。原因很简单：排名有排名的逻辑，量化有量化的理由，专业的高等教育研究者和研究机构如果试图基于测量进行大学评估，也只能服从量化排名逻辑而放弃对学术逻辑的坚守。这也是为什么专业的高等教育研究者和研究机构参与和主导的量化评估同样忽略了高等教育的本质和对大学发展的深层次哲学思考，同样将注意力集中在指标体系设计上，选择以可测量的指标对原本十分复杂的大学发展进行简单化测量的原因。

当然，如果专业的高等教育研究者和研究机构不介入大学排名，而是对大学评估进行更加系统和长期的理论研究，是不是一定能使大学评估具有科学的根基，并可通过科学的评估促使大学不断改进也未可知。毕竟科学或许可以帮助我们从理论上更好地理解大学与其他社会子系统的互动，并增进在相关领域的知识积累；但对如何精确地测量大学，直到今天，人类科学仍然无能为力或收效甚微。实践中的大学评估只能是“大致的正确”。如哈耶克所言：“在这些领域中，我们只能够获得这样的知识，因此对这种知识采取不予信任的态度也肯定是于事无补的。”^[¹^]尽管如此，可以肯定的是，在大学评估这个错综复杂的领域，面对排名的盛行，专业的高等教育研究者丢掉专业判断是容易且危险的。在评估实践中大学不是绝对不能基于测量进行排名，排名本身对大学也不是完全没有积极影响；但必须牢记在大学评估中可以量化的事项极其有限，而且这些可测量的未必是大学至关重要的部分。因此，决策时不能将排名置于大学本质之上，以量化的精确评估替代大学发展的实质。那种认为只要通过量化评估将大学置于“竞争环境”就可以提高“效率”的想法，不过是一个凭空的假设。^[¹²^]本质上，大学发展事关“学以成人”和“创新创业”，绝不是简单的排名可以评估的，更不能“以排名论一流”。遗憾的是，目前由于专业研究者和学术机构的深度介入，加之政府和社会的承认或变相承认，排名在公众心中似乎具有了科学意义抑或大学排名本身成了一门值得研究的科学，那些碰巧可测量的指标成了大学评估实践得以实施以及大学评估理论得以建构的基础。专业的高等教育研究者和研究机构也开始围绕评估和排名问题展开学术研究，使原本出于商业或行政原因发布的评估结果或排名因学术界的参与而被贴上了“科学”的标签，原本只是媒体“自娱自乐”的大学排行榜“披上了科学的外衣”，逐渐在大学量化评估中占据主导地位，成为政府和社会评价大学发展水平的主要参考。其结果是，当政府和社会无法判断大学的好坏抑或某项改革的成效时，自然而然地就想起了大学排名，各利益相关方也理解并同意这一做法。

直到今天，受制于大学自身的复杂性以及高等教育研究进展的有限性，大学评估的专业性仍缺乏充分依据。和自然科学研究不同，高等教育研究中理论和实践之间没有明显的边界。理想情境下，每个理论研究者必须熟悉高等教育实践，而实践工作者也必须熟悉高等教育理论。大学评估表面上属于技术性工作，主要是高等教育实践活动的统计分析，不涉及高深的教育理论；实质上由于高等教育活动的复杂性，如果大学评估专家只懂评估技术而不懂高等教育基本原理，量化评估结果对大学发展将十分不利，甚至有害。根本上说，“我们绝不能把人们能够据以辨识某种特定类型的理论性情形的标准描述成一种简单且几乎像机械定理一般的标准，而只能够去培养某种类似于观相术的感觉。因此，我们几乎无法把应用我们知识的事情交给其他人去实施，而必须亲自去实践———我们既是医生又是生理学家”^[¹^]。这也就意味着大学评估专家必须精通高等教育理论和实践。可现实情况是大学评估仍主要被看作一项技术工作，评估专家精通测量和统计技术，但缺乏对评估背后教育哲学的反思。结果导致大学评估从指标体系上看越来越丰富，形式越来越合理，似乎在尽可能满足和照顾大学的特殊性以及诸利益相关者的关切，但隐藏在评估背后的仍然是测量主义而非人文主义哲学。参照量化评估结果，政府和社会的资源配置自然倾向于排名更前的大学而不是靠后的大学。因为如果说没有证据证明前者对经济社会发展的贡献比后者大，那么更没有证据证明后者对经济社会发展的贡献比前者大。如此一来，以排名方式呈现大学评估结果就具有某种合理性（政治正确性和经济正确性）。质言之，在测量时代高等教育研究本身并不拥有超越量化评估的话语权，也无法基于大学的复杂性发展出符合大学实际的评估理论和技术。现有高等教育知识和常识理性告诉我们，过度量化的评估与排名对大学发展不利，可一旦面对政府问责压力以及社会对大学的不满，基于测量的评估又不可避免。在利益相关方看来，虽然把评估大学的权力交给那些不懂大学的人是危险的，但实践中如果无法对大学作出量化评估可能意味着更大风险。结果就是随着各种基于统计和测量的大学评估大行其道，政府、社会、大学都开始把排名式大学评估看成自然的、正常的事。

综上所述，从科学的角度讲，对大学进行量化评估是不可能的。根源在于大学的复杂性以及人理性的有限。人的有限理性不足以理解大学发展的所有细节，也不可能设计出符合大学发展实际的指标体系，更不可能进行精确的测量。这也就注定我们只能大致知道大学的好坏，而不可能对大学进行精确测量。在理论上，洞悉理性的限度是有效运用理性的前提，不承认理性力量的限度实际上也就趋于使人之理性变成一种低效的工具。^[¹^]但实践中人总是高估理性的可能性，并为了证实这些可能而采取各种“变通”。在有限理性无法转变为完全理性的前提下，为完成对大学的精确测量，评估主体能做的就是“简化”大学的复杂性，并以“简化”后的大学为对象来设计评估指标体系，赋予不同权重，进行精确测量。因此，无论何时讨论大学量化评估结果或排名，必须先清楚它们的对象是“简化”后的大学，而不是一个真实的大学。“排行榜本应就大学对社会所作贡献的核心部分———教育及研究的活力进行评估，但事实上排行榜却未能达到这一目的。”^[¹²^]基于量化评估逻辑，评估结果只在特定指标体系下才能被有效解释，评估结果与大学发展实际水平和真实状态之间没有直接关系。换言之，量化评估结果只对评估指标体系负责，不对大学负责。排行榜上排名靠前的大学，可能只是与指标体系吻合度高的大学，不一定是真正卓越的大学。

二、大学量化评估的外部诱因

近年来，大学量化评估盛行除了有“内部动因”之外，也与大学所处社会环境和时代精神状况密切相关。与传统社会不同，现代社会的制度体系呈现一种相互需要信任但又相互不能信任的复杂状态。为了满足信任需要或维持最低限度的信任，现代社会中的组织和个人都要不断改进机制设计并提供“证据”以证明自己值得信任、可以信任。大学也不例外。“进入20世纪80年以来，随着政府支出的普遍性削减，高等教育也已经不再是神圣领域。同时社会普遍对于大学的看法日趋严格，过去对大学人的充分信任的氛围已日趋淡薄。”^[¹²^]在此背景下，所谓“评估”就是大学为获取信任的“自我证明”和“被证明”，即通过展示评估结果向政府和社会证明自己是值得信任的。但如果认真分析，“自我证明这个概念是个悖论。要证明自己其实就是没有自己，意思是说，要通过已经预设的原则和标准、别人的逻辑和流程来证明自己的存在，其实是取悦别人，把自己搞没有了。前提当然是自卑。自我证明是很危险的”^[¹⁷^]。在量化评估过程中，无论是“自我证明”还是“被证明”，大学在赢得一种信任的同时也在失去另一种信任，“对指标的信任导致了对判断的信任不断减少”^[⁸^]。具体来说，以测量为目的的大学评估在向政府和社会证明大学绩效的同时，也在削弱大学及大学人对自身所作专业判断的信心。作为一种“外部的压力”，大学评估可以强化外部人和内部人对大学的双重控制，但无法从根本上弥补大学人与大学、大学与政府和社会之间的制度性不信任。长期来看，模拟市场化不能形成安定的社会、政府与大学的关系，评估主义不过是近代大学模式走向新大学模式的过渡期产物。^[¹²^]我们时代如果无法克服这种制度性不信任，现代大学改革就可能掉进评估主义陷阱，错失在后工业社会中可持续发展的战略机遇。

在传统的政府与大学关系中，法定权力是政府实施大学外部治理的主要媒介。但高等教育治理实践中权力介入经常会干扰大学办学，引起大学反感，有时还会激化政府与大学间的冲突。为避免权力冲突，以问责制为基础的绩效评价成为大学治理的重要政策工具。将评估结果与拨款挂钩，大学管理者和政府官员通过收集并操纵数据可以控制几乎所有大学资源以及资源配置方式。在这种新型治理实践中，通过设定评估指标，将测量结果透明化，大学发展被“问题化”。在各排行榜中，除了第一名，可能其余大学都呈现这样那样的不足和缺陷。为解决存在的问题，大学内部被管理者“控制”，外部则被政府“控制”。和权力干预相比，以绩效评估作为“治理术”，原本属于大学教授的学术权力被成功转移到行政部门和评估专家手中。大学里的学者尽管在不同学科接受了长期专业训练，熟谙本学科专业知识体系，但在评估指标和绩效评价的“暴政”下，他们失去了对于大学、学科以及自身学术发展的评判权，大学、学科以及学者自身的发展都被外在的评估指标体系制约。在这种体制下，大学和学科的发展甚至学者自身成长都由评估专家来设计和规划，再由政府和大学管理者负责监督、控制和强制执行，大学、学科以及学者只要按照评估专家设定的指标体系努力就行了。但事实上那些评估专家只精通分析和操纵大学评估的指标和数据，根本就缺乏甚至没有关于大学发展的经验和实践知识，他们及其发布的排行榜也不需要对大学发展负责。吊诡的是，很多大学在制定发展规划，尤其是制定建设世界一流大学方案时却经常向那些评估或排名专家进行咨询，或者直接参考排名结果制定发展战略。究其原因，相比充满不确定性、模糊性和晦涩的高等教育理论研究成果，排行榜的信息简洁、清晰且容易理解，精确的数据似乎更科学和客观，更适合作为政府官员和大学管理者的决策依据。结果就是，那些发布大学排名的评估专家被认作高等教育研究专家，而严肃的高等教育研究成果反倒无人或少有人问津。但是，那些看似科学的排名未必科学，甚至一定不科学。量化评估追求更“正确”，却产生了负效果。^[¹²^]

当前在制度性不信任框架下，大学量化评估兴起的一个重要诱因就是政府和社会对大学花费巨额资金而没有作出相应贡献心存不满，遂尝试通过评估促使大学提高资金使用效率，培养更多专业人才、产出更多科研成果，以更好满足经济社会发展的需要。“在知识的经济价值不断增大的同时，对大学所提出的要求，明显地多样化，并且在急速变化。过去社会对大学所抱的无条件信任发生了动摇，要求大学更有效率地为社会做贡献。”^[¹²^]量化评估蓬勃发展丰富了政府的政策工具，迫于问责和绩效评价压力以及对经费削减的恐惧，大学在政府面前更加“温驯”和“听话”。吊诡的是，政府和社会发起评估的本意是发现大学的不足并促其不断改进，但各种评估似乎都显示大学表现得很优秀或一直在有计划地进步。对政府和社会而言，量化评估失去了诊断和改进的意义，反倒成为大学证明自己高效运营的数字游戏。以英国的“卓越研究框架”（research excellence framework）为例，这个评价体系曾花费约2.5亿英镑得出约3/4的英国大学为“国际卓越”（46%）或“世界领先”（30%）、另外20%为“国际认可”的结论，但它的真正价值（或管理者所谓的“增值”）是什么呢？^[²^]不只是英国，很多国家的大学评估都面临这种悖论。只要政府或第三方评估机构设定指标，大学就会在相关指标上表现愈来愈好，直到基于这些指标的评估结果因失去真实性或政策工具价值而废止。任何指标一旦被作为判断大学优劣的“标志物”，立即就引发大学对它的额外关注，从而导致指标“腐败”，最终使基于该指标和指标体系的评价结果失真并失效，也使基于这些评估结果的政策受到质疑。“大学评估机构很可能陷入一方面花费巨额资金，另一方面又未必能够充分说明其对社会的贡献这样的严峻处境。为了避免这种境况，可能会进行大量的评估活动，这样又会使各大学为接受评估做大量的准备工作而阻碍大学自主改善的机制，结果，评估本身成为评估的目的。”^[¹²^]对于大学评估，真正重要的并不是能否找到一组指标来对其进行精确测量并排名，而是选择适合评估大学的理论、方法与技术，把与大学发展相关的诸要素整合起来以呈现大学发展“图景”，对大学现在的情况及未来可能的方向作出原则性判断，而非具体预测或详尽说明。

除上述“政治”因素外，大学量化评估还与“经济”因素有关。二战以后，受新自由主义经济学影响，“从大学外部来看，大学似乎在进行着极不透明且非效率的经营。在这种意义上，在大学内部也具有能够接受导入市场机制的基础”^[¹²^]。如果说基于社会化大生产的工业社会是效率时代，那么基于信息技术和大数据的后工业社会则是测量时代。就像在效率时代，效率本身就是目的，在测量时代，测量本身也是目的。明知有些事物不可精确测量或不值得测量，仍然强行去测量，甚至尝试去测量本身已成为一种智性“美德”。究其原因，一方面是我们不愿意承认理性在评估大学时的有限性，另一方面则源于我们对数据的迷思，那些标准化的数据作为决策证据似乎比个人基于经验的专业判断更有力。作为现代社会的第二中心，企业对效率的追求显著提高了经济社会发展水平。对企业而言，提高生产效率一般有两条途径，一是在质量不变情况下降低成本或在成本不变情况下提高质量，二是在降低成本的同时提高质量。现代企业通过技术和管理创新满足了政府和社会的效率崇拜。“文化传播过程理论认为，观念和价值一般来说是从在一种文化中地位高或权力大的团体流向地位低或权力小的团体的。”^[²⁵^]统计和测量在企业管理中成功应用刺激了其他组织，它们也幻想企业那些方法可以用来提高大学的人才培养和科学研究质量。事实上，企业生产效率提高主要得益于市场化制度环境，而非量化管理。与企业相比，大学之间并不存在严格意义上的市场。大学作为社会制度的一部分服膺高深知识生产与传播逻辑，而非受市场“看不见的手”的调节。但近年来出于效率崇拜和对绩效的迷思，政府很多政策都假定大学就是企业，以评估为政策工具强行在大学之间人为地制造一个“模拟市场”。在这个“市场”中，以排名为标志的量化评估激化了大学间的竞争，虽在某种意义上也提高了人才培养和科研生产效率，却没有也不可能造就更好的大学。除了作广告宣传以扩大名气，排名结果不可能给学校带来实质的改变。“特别是如果对大学的财政支援过度依赖于短期研究的绩效评价的话，不仅会危害长期性研究的生产效率，而且会妨碍教育质量的提高。”^[¹²^]大学的产出根本无法精确测量，严格按一些指标进行测量和排名只会导致放弃长周期研究而重点关注具有短期效益的研究。最终从年度进展看，那些名列前茅的大学每年都取得了骄人成绩，进步明显；但长期来看，无论是人类知识进步还是经济社会发展，今天的大学可能并未比过去的大学作出更杰出的贡献。

强势的企业管理时尚只是一方面。大学评估之所以风行也与大学作为专业组织面对经济社会发展挑战时的软弱与脆弱有关。这和20世纪初教育领域的情形非常相似。当时“商业对学校管理者们产生了直接影响，又通过他们对学校产生了间接的影响，这两种影响根源于一对双生因素，它们好似一枚硬币的正反面：一面是效率时代里学校和教职工的脆弱性，一面是商业群体和商业哲学的强大冲击力”^[²⁵^]。受商业管理的影响，20世纪初功利主义和实用主义运动就开始在大学里蔓延。二战以来，随着高等教育规模增大以及大学在经济社会发展中地位的提升，政府和社会对大学的不满和批评也不断增加。究其原因，更大规模的高等教育需要更多资金支持，而更多的资金支持意味着大学要向政府和社会证明这些资金的使用是合理、有效的。面对问责和绩效评价的巨大压力，为了能合理、持续地得到政府和社会大力支持，大学面对评估时几乎完全屈从于政府和社会压力，主动适应评估指标，放弃了自主性原理。当政府和第三方机构将不合理或无效的指标应用于大学评估并基于测量进行精确排名时，很少有大学反抗。即便少数大学偶尔作出拒绝参与的姿态，稍后大都也会选择妥协。对大学管理者而言，迎合排名并非被迫作出的决策，相反，排名成为他们平息社会不满和应对政府问责的有力工具。至于这种评估是否真正有利于实现高等教育和大学卓越，并非他们最主要的关切。凭借各类排行榜上的名次，大学管理者最终成功应对了政府和社会对大学的问责，但代价却是阻碍了大学的转型发展。在问责和绩效评价的巨大压力下，大学管理层、教师甚至学生都将大量资源和精力投入到排名相关指标上，忽视了大学内部其他至关重要但可能与排名无关的事务。基于排名的“名气”逐渐替代传统的“声誉”或“名声”，成为大学卓越的象征。“在这种情况下，大学最好的方法是雇佣有能力的研究人员，或解雇没有成果的研究人员。于是大学之间的激烈竞争形成了，主要表现在招募争夺对方的研究人员。随之，大学对人员的管理能力需要加强。但是需要注意的是，高等教育界的研究成果的总量并未因此而增加。竞争本身并未提高生产力，至多是内部的竞争，得到零和博弈的结果。”^[¹²^]短期来看，大学对排名的这种态度或许可以暂时取悦政府和社会，但过度重视排名的危害是长期且深远的。排名只能驱动大学追逐更高名次，并不能驱动大学内涵式发展。排名指标化和精确测量极易并正使大学发展趋于同质化，高等教育发展模式趋于统一化。然而真正的发展意味着“创造性破坏”而不是“循规蹈矩”、“按部就班”。对大学而言，如果“没有产生在质上的新现象”，如果没有“从内部自行发生的变化”；如果只是“被周围世界中的变化在拖着走”，如果只是不断使自己适应政府和社会提出的各种量化目标，那么就谈不上真正的发展，充其量只能看作高等教育增长相关“数据的变化”。^[²⁹^]

在特定政治经济条件下，大学在量化评估面前的脆弱性不是偶然的，是由其组织特性和社会经济地位决定的。直到今天，虽然名义上大学在经济社会发展中的重要性不断提高，但这种重要性主要是一种工具性。与政府和企业相比，大学仍处于社会边缘，大学的特殊性以及高等教育管理的专业性仍不为政府、社会所承认，甚至大学管理者对大学管理的特殊性和专业性也缺乏信心。受管理主义影响，大学经常主动模仿、复制企业和政府的管理时尚，并将企业和政府已淘汰的管理方式引入大学；政府、第三方机构在评估大学时也更倾向强调组织间的相似性而不是大学与其他组织的差异性。因此，政府和社会第三方机构参照企业产品质量排名和竞争力排名的套路对大学进行评估和排名也就不可避免。但事实上大学的发展事关人类教育和知识创新，涉及人的成长和知识进步，作为历史悠久的专业组织，大学有自己的规则系统，外部规则的简单移植只会干扰和破坏大学内部规则系统的有效运行，而不会导致制度创新。“如果我们试图根据刻意的安排去改变这种秩序中的任何一个部分，那么我们根本就不可能使这种秩序得到改进，而只能扰乱这种秩序。我们所能够指望的也只是一种缓慢展开的逐渐改进的尝试性过程，而不能指望任何一步到位的改革。”^[¹^]大学管理对企业管理的简单模仿、在大学评估中简单引入市场化机制、将量化评估结果与财政拨款挂钩，非但不能促使大学更好地满足经济社会发展需要，反而会导致政府和社会将大学组织特殊性“悬置”，甚至诱发社会对大学专业精神以及大学作为专业组织的怀疑，进而将强调大学评估的特殊性视为大学的自我防御，最终进一步削弱大学在经济社会发展中的“领导力”。

三、如何理解量化评估与大学发展的关系

长期以来，评估虽与大学共生，但其结果对大学发展并无显著影响。大学评估通常以非制度化形式隐匿于大学生活中，那些或正式或非正式、溢美或批评的言辞往往成为大学历史和文化传统的点缀。相比之下，今天的大学量化评估日益制度化，每次评估的结果都可能成为大学发展中利益攸关的大事。“开展自我评估和自我改进，将关系到一个高等教育机构以及作为社会制度的‘大学’将来的地位。大学评估对于高等教育的发展在维持高等教育的质量标准，强化大学的自律性经营能力，促进资源分配的有效性等三个方面具有现代意义。”^[¹²^]当今时代，评估对大学发展之所以非常重要，不是因为评估本身重要，而是因为大学在经济社会发展中的地位变得日益重要。为使政府某些重大政策以及大学战略决策在技术层面更具可行性，简化后的大学评估结果成了重要参考。近年来，无论国家层面的世界一流大学建设，还是大学层面的建设世界一流大学，主要排行榜的大学排名都在其中起到了重要作用。对国家而言，排行榜的排名成为检验高等教育政策效果的标尺；对大学而言，排行榜的指标体系成为在短期内迅速提升排名的重要抓手。但事实上建设世界一流大学需要的是对大学内外各种力量的长期培育，而不是基于评估指标对大学成长过程予以计划和人为控制。“世界一流大学的联合潜力远不仅仅是新自由主义模式下大学的‘自我服务公司’（self-serving firm）角色以及由排名位置决定的品牌价值。”^[³²^]遗憾的是，虽然在认识层面上政府和大学都清楚不应围绕排名办学，但在未找到更合适的政策工具之前，实际操作中排名结果及指标体系仍实实在在地影响着国家科研战略和大学发展方向。

当前在评估主义氛围下，政府的高等教育政策并非都是理性选择，有时候一些政策完全是对政治经济思潮或时代精神的无意识反应。换言之，当社会上充斥各类大学排名，当各国都在大力推进精确化大学评估，那些还未将基于测量的排名引入大学评估的政府面临更大的舆论压力。为顺应时势或从众心理作祟，政府只好假定大学可以根据指标进行排名，而排名结果也可作为政策和决策的参考。此外，在高等教育大众化、普及化时代，随着院校组织规模扩大，大学管理者也愈来愈热衷“行政管理”而非“学术事务”。由于日益远离学术前沿与中心，大学管理者在作学术决策时通常优先考虑政策的可操作性而非科学性。“本着‘问责’精神而创建‘透明’绩效指标的愿望，往往转化成采用标准化的集中指标，因为远离一线操作领域的上级和公众更容易理解这类指标。通过定量测量来传达的观察，往往被视为‘实证性的’；而以定性形式传达的观察，往往又被认为不够可靠。如今的发展趋势是把一件主要是艺术、需要基于经验判断的事情，当成纯粹的、可测量的科学来处理。”^[⁸^]过度简化和量化的指标体系使大学评估结果越来越精确，但评估本身对大学发展的影响很难说是正面的。

以过度量化方式展示大学评估结果，除了方便利益相关方就大学发展达成共识之外，并不能切实促进大学教育和科研质量的提高。将评估结果直接与财政拨款挂钩更会威胁高等教育质量，抑制创新创业的可能性。虽不排除有研究者和管理者真诚相信排名可以促进大学的改进，但实质上大学排名结果更像是利益相关方的自我保护。相比大学评估和排名结果的客观与公正，大学管理者更在乎评估和排名的社会影响。大学管理者的关注点几乎都在提高排名上，而不在意相关指标是否合理、有效，更很少去批判性思考与讨论评估和排名对大学发展的危害。实践中大学的改进和成长是缓慢的，但基于测量的大学评估隐含的假设却是大学在每年或任一时期都发生了显著的可以测量的进步。“测量的进步取代了实际的进步，变成了对成功的模拟。”^[⁸^]以排名论一流的倾向迫使大学重视短期业绩，忽略了长期的卓越目标，从而加剧了评估给大学发展带来的风险。对于大学评估，我们必须承认理性的有限性，必须克制对测量的热情。大学发展涉及人的成长与塑造，涉及知识的创新与扩散，精确评估几乎是不可能的。为评估而评估，对某些指标的精确测量可能造成非预期的负面后果。那些被强化指标表现优秀并不意味着大学表现优秀，而且那些指标背后对应的大学实践必然遭到忽视和削弱，不利于大学的可持续发展。尤其重要的是，强势的评估及精确的排名固化了大学学术秩序，抑制了组织的创新创业精神。对大学发展相关数据的简单整理，提供若干单项以及综合得分以供比较不同国家的不同大学，这种极端简化的信息以定量方式扭曲了人们对大学的理性认知。原本多样性的大学被单一维度地排列在不同位次，大学独特的历史传统与学术文化全被消解。

当然，这样讲并不意味着反对大学评估，甚至也不是反对以测量方式对大学进行评估。事实上从当今时代高等教育改革和发展实践出发，大学评估是必不可少的政策工具，基于指标的测量也是不可缺少的大学评估方法。我们真正要警惕的是过度量化的评估以及评估主义。对大学发展而言，评估绝非越精确越好，更不是只能以量化评估促进大学发展。不可否认，量化评估可为人们提供关于大学质量的信息，排名先后与升降有时也可间接反映大学发展的某种状态。但无论如何“精确”，评估只是评估，只是评估主体出于特定目的、依据某种标准对大学的主观认识、判断，绝不能把量化评估结果等同于大学发展本身。“如果评估结果被用作某种判断标准，则被评估大学就事先设定将来达成的目标，最后变为对大学机构总体的‘努力’及‘积极性’进行评估这样令人质疑的做法。”^[¹²^]排名的确可以反映一所大学在世界大学系统中的相对位置，但如果简单地以排名来判断哪些大学是世界一流就会存在问题。正如股票市值受价格泡沫影响而无法反映公司的真实运营状况，排名也会受“学术泡沫”及其他因素影响，无法反映大学的真实状况。虽然那些真正一流的大学无论在哪个排行榜上都排名靠前，但这绝不意味着排名靠前的一定是世界一流大学。实质上，那些真正的世界一流大学早在排行榜出现之前就已是世界一流了。在排行榜出现之后，它们只不过维持、保持了原先固有的地位。对这些大学而言，无论有没有大学排行榜，它们一直是世界一流。由此可见，排名或可以作为判断一所大学是否世界一流的参考，但绝不能将排名的某一位次区间直接等同于世界一流。排名位次只是计算后的客观结果，无法自动转化为价值判断。归根结底，一所大学是否世界一流，主要取决于大学人的常识理性以及知识相关者的普遍认可。如果一所大学在理念与制度层面不符合大学人对卓越大学的认知，如果一所大学的知识贡献未得到知识相关者的承认，无论排名如何靠前，它都很难说是世界一流大学。“许多重要事项，对判断和阐释的依赖性太大，无法用标准化指标加以解决。归根结底，关键不在于让指标与判断截然对立，而是要让指标为判断提供信息，这就包括知道要为指标分配多大的权重，意识到指标的典型畸变，以及理解什么东西无法被测量。”^[⁸^]对于世界一流大学的认知和判断同样如此。

从历史与比较的视角看，世界一流大学既不是量化评估评出来的也不是排行榜排出来的。对全球共同利益的承诺是大学成为“世界一流”的核心。^[³⁷^]作为全球“共益物品”（common goods）的重要提供者，真正的世界一流大学既要对人类经济社会发展作出不可替代的贡献，也要对人的发展作出不可替代的贡献。对经济社会发展的贡献主要体现在“物的再生产”，即通过科技创新不断提升生产力和生产效率；对人的发展的贡献主要体现在“人的再生产”^[¹⁷^]，即让人成为更好的自己。当前在量化评估模式下，我国高等教育发展和世界一流大学建设主要面向“物的再生产”，相对忽视了“人的再生产”，即重视人力资本对经济发展的贡献，却相对忽视“高等的教育”之于人生活方式和精神世界的重要性。从财政角度看，我国大学要成为世界一流需以经济持续发展为基础，经济保持可持续增长对大学能否成为世界一流具有决定性意义。但问题的另一面在于，无论如何经济因素对世界一流大学建设只是必要条件而非充分条件。真正的世界一流大学必须高度关注“人的再生产”而不只是人力资本的生产。从工业社会向后工业社会转型的过程中，“人的再生产”的重要性将愈加凸显。从长远来看，“人的再生产”决定“物的再生产”，没有“人的再生产”，“物的再生产”将失去意义和方向。归根结底“人是目的”。人需要的是“美好生活”而不只是丰裕的“物质”。“物的再生产”终究要服务于“人的再生产”。面向未来，我国高等教育发展和世界一流大学建设需要克服以经济建设为中心的结构困境，更加注重通过“高等的教育”实现“人的再生产”与“物的再生产”的统一，进而成为启蒙和形塑新社会关系的主要力量。

摘自《高等教育研究》2020年11期；作者：王建华（1977-），男，河南息县人，南京师范大学教育科学学院教授，博士生导师，从事高等教育基本理论研究。

上一条：高等教育基本关系与高等教育学体系建设下一条：构建适应新发展格局的终身学习体系