刘彦林：人工智能时代的社会科学科研评价优化研究

摘要：生成式人工智能在社会科学研究中的广泛应用给当前科研评价体系带来了机遇与挑战。新时期社会科学在研究范式、组织形式、科研生态三个层面的演变，对社会科学科研评价基于新的科研规律优化评价标准与方法，加强跨学科及团队成果评价，引导研究增强人的主体性与现实关怀提出了新要求。人工智能的发展为社会科学科研评价理念与时俱进、评价方法提质增效提供了可能，但在意识形态、价值判断、人文关怀等方面应注意人工智能的应用限度，并有效防范模型局限、偏见引入、数据安全等风险。因此，应协同推进人工智能科研评价大模型建设，提高科研评价人员知识素养、人工智能应用能力和责任意识，加强模型开发规范和不当使用追责法律体系建设。

作者：刘彦林，中国社会科学院中国社会科学评价研究院副研究员

摘自：《湖北社会科学》2025年第3期

原题：《人工智能时代基于规律演变与技术赋能的社会科学科研评价优化研究》

本文载《社会科学文摘》2026年第1期

深入思考生成式人工智能给科研评价带来的机遇与挑战，对于把握科技革命机遇、科学应对冲击、推动科研评价优化具有重要意义。本研究在分析人工智能时代社会科学研究规律演变的基础上，总结社会科学科研评价的适应性优化需求，并基于技术赋能的优化思路，为社会科学科研评价有效应对挑战、把握机遇提供参考与借鉴。

人工智能时代社会科学研究规律演变

（一）研究范式：智能化科研范式

生成式人工智能在社会科学研究中的深度应用驱动形成第五科研范式（AI for Research），也有学者将其称为“Science by Human Being+AI”，其核心是科学研究从传统的“人人”互动转为“人机”互动，机器涌现智能成为科研组成部分。

研究主体由科研人员及其之间的互动转变为研究人员和生成式人工智能之间的互动。生成式人工智能具有一定的技术自主性和主体性，在参与科研活动中具有一定的意向性，成为科研组成部分，从而颠覆了以往科学研究的人类中心主义假设。人类与大模型紧密的认知互动和创新协同，在延展人的感官和计算能力的同时，也促使机器在不断学习进化中反过来塑造人的思维和行为，人机协同将成为生成知识的新范式。

生成式人工智能对经济发展、社会治理等领域的广泛影响为社会科学提供了重要研究议题。既可在“技术决定论”思路下研究生成式人工智能技术对各种社会现象产生的影响，也可在“技术建构论”思路下研究生成式人工智能的特征，并思考如何使其特征符合人类社会的基本伦理和价值。研究对象逐渐向数据化、结构化转变。

生成式人工智能在研究方法上具有强大优势。生成式人工智能能够有效应对计算复杂性较高的组合爆炸问题，在解决不确定性问题方面有强大优势，还能帮助突破个人认知和有限理性局限，通过人机协同等方式改变人类决策方式，解决“哈耶克难题”，并能实现多种学科、多种方法的有机融合。

知识生产范式转向“发现—验证”式研究路径。生成式人工智能基于数据驱动的科研活动是被动式的事件导向研究路径，基于多维度、多层次的事件信息形成多维性、全局性的新认识，呈现“发现—验证”的路径特点。知识需求与知识满足在人机之间弥散，知识创新、知识传播、知识扩散的边界融合，三者之间的关系从线性传递转变为同步演进和相互促进。

（二）组织形式：跨学科、跨领域合作与科研重心偏移

跨学科合作呈现出跨度更大、合作范围更广的特点。原因在于生成式人工智能强大的知识整合与传播功能为更大范围的跨学科合作提供了知识基础，生成式人工智能模型开发与训练又有开展更大范围、更多领域的跨学科合作的现实需求。

在生成式人工智能模型开发过程中，科研活动趋向团队化且科研重心向企业偏移。生成式人工智能模型开发具有跨学科合作需求，将推动科研活动趋向团队化。企业资金雄厚，又有基于科技前沿营利的内生动力，生成式人工智能及相关的跨学科研究重心将极有可能向企业偏移。

生成式人工智能模型成熟稳定后，科研活动可能趋向个体化。在生成式人工智能模型建成之后，学者对学术思想的检索、整合、深化可能主要通过与生成式人工智能大模型的对话来完成，使得科研生产方式趋向个体化，高校、科研机构等知识生产的中间组织将面临重塑或解体。

（三）科研生态：等级化与分化

生成式人工智能在不同知识生产领域的成熟度差异可能导致开放性、常规性等特定类型研究式微。人机互动形成的科研成果导致学术责任分散，生成式人工智能强大的改写能力使抄袭等学术不端行为更具隐蔽性，学术传播加速则会加剧学术造假和错误知识引发的信任危机，三方面因素共同作用，可能引发学术伦理失范危机。生成式人工智能深度参与科研活动，可能导致科研成就对人工智能技术与平台的依赖性增强，从而加剧科研领域的等级分化。这一分化发展到极致可能导致最常用的生成式人工智能平台形成知识垄断，成为硅基意义上的知识权力中心和新的“知识寡头”。

基于规律演变的社会科学科研评价优化需求

（一）基于新的科研规律升级评价标准与方法，适应科研范式变化

一是重新审视评价对象界定标准。对于生成式人工智能占主导地位，甚至作为主体产生的科研成果，以及生成式人工智能生成的不可解释、不可复制，但具有实效性的知识，可能需要为其单独开辟评价通道。二是有效识别实质性创新，提高评价效率。在科研评价中应对实质创新进行有效识别，尽力规避对低水平重复和文字游戏类研究的不正当激励。评价机构还应在人工智能协助下提高评价效率，或设置合理的遴选程序，仅对真正有价值的科研成果进行评价。三是增加生成式人工智能参与部分的真实性审查和生成式人工智能应用风险审查。四是在科研成果社会影响评价中纳入反映成果在生成式人工智能大模型开发训练中的作用与贡献的指标。

（二）加强跨学科及团队成果评价，适应科研组织形式变化

一是加强跨学科成果评价，根据跨学科成果特点优化评价标准与方法，提高专家跨学科评价能力，加强跨学科成果的贡献认定、权属划分实践探索与经验总结。二是加强团队成果评价，加快研制团队成果评价标准与方法，并探索个人贡献计算方法、知识产权划分经验，加快探索科研团队、生成式人工智能大模型平台层面的综合评价。三是灵活确定评价层次。根据新的科研组织形式特点，加快平台、实验室、研究机构层次科研评价实践探索，探索组织协调能力、团队领导力等软实力评价。

（三）增强导向作用，有效应对科研生态变化

一是引导在科研活动中加强人的主体性，提倡科研人员独立思考，避免过度依赖生成式人工智能。二是引导社会科学研究增强问题意识、凸显现实关怀。三是引导营造尊重多元科研生产方式的科研文化，避免对未利用生成式人工智能大模型的传统研究形成歧视，推动社会科学研究多元发展。四是引导支持开放性探索与非共识性研究，有效应对生成式人工智能广泛应用可能带来的科研同质化和知识垄断风险。

基于技术赋能的社会科学科研评价优化理路

（一）评价理念的与时俱进

从片面评价到全面评价。全面评价体现在评价主体、评价对象、评价维度等层面，指全面采集学者、读者、政策制定者、实践工作者、第三方评价机构、新闻媒体等利益相关者的反馈，对包括大众读物、网络文章等在内的各类成果的学术贡献及社会影响开展长周期、全过程评价。

从事后评价到前瞻性评价。前瞻性评价在微观层面体现为预判科研成果的未来影响力、应用前景和潜在风险；在中观层面体现为诊断科研机构的发展战略、储备性科研布局和发展潜力，为科研机构结合自身特色进行差异化、特色化发展提供精准指导；在宏观层面体现在利用数字孪生技术模拟评价活动与科研生态的互动关系，推动科研活动可持续发展。

从结果性评价到发展性评价。借助生成式人工智能强大的深度挖掘、模式识别和预测未来趋势能力，基于长时段、多维数据建立科研人才发展模型，总结创新领军人才成长规律，完善科研人才分类分层评价体系，加快建立多措并举、精准施策、广泛联动的科研人才培育体系。

（二）评价方法的提质增效

提高科学计量学、替代计量学的科学性和全面性。借助生成式人工智能准确区分引用类型、引用情感，针对性地设计量化评价指标，采集多元传播和应用数据。

提高同行评议公正性与效率。生成式人工智能可根据论文主题与研究方法匹配专家，根据作者单位、主要合作关系、师承关系等设置回避条件，高效遴选学科知识匹配、利益无涉、评价信用良好的专家。评价机构可借助生成式人工智能分析同行评议公正性的影响因素，并进行必要调控。生成式人工智能既可对成果、课题申请书进行规范性检验，还可为评价组织、同行评议提供参考信息，从而提高同行评议效率。

改进社会影响评价方法。生成式人工智能可以通过采集与分析网络文本信息、用户与生成式人工智能的交流互动等过程性信息，测度社会科学成果在公众意识、批判性思维、重大政策认可度等方面的贡献。

科研评价中生成式人工智能的应用限度与风险防范

（一）社会科学科研评价中生成式人工智能的应用限度

社会科学成果的意识形态审查需由专家综合判断。社会科学的研究对象、研究方法、研究过程、研究发现体现了一定的政治性、民族性和阶级性，具有较强的意识形态属性。社会科学成果的意识形态审查需由同行专家基于立场独立客观、文献梳理全面、问题导向客观、研究方法适切、理论基础包容、结果解读客观等标准进行综合判断。

社会科学科研评价中的价值判断需由同行专家评判。社会科学科研评价中价值判断比例更高，且具有一定预测性，无法简单通过程序与代码进行决定性判断。社会科学领域的科研评价依然要保证人在评价中的主体地位，由同行专家对创新价值进行判断，不能过于依赖技术，片面强调可测量性与表面价值，而忽视难以被数据化的本真价值、本质和内在价值。

社会科学科研评价中的人文关怀需由同行专家主导。社会科学领域的科研评价活动还应具备一定的人文关怀，体现多元价值。对人文关怀的评估，应由同行专家综合各种信息，协调多种制度逻辑与利益关系，进行复杂决策。

（二）社会科学科研评价中应用生成式人工智能的风险防范

生成式人工智能科研评价大模型科学性局限风险防范。生成式人工智能科研评价大模型存在人类理性与算法设定自身的系统偏差，以及人工智能模型的明确性、统一性对社会科学的多元性适应性不足导致的科学性局限。为应对相关风险，一要提高训练数据的全面性、代表性，探索多元的评价方法与指标；二要深化分类评价理念，根据学科差异、成果类型、评价需要及时调整评价标准，针对性优化指标权重和模型参数；三要加强生成式人工智能科研评价大模型的元评价，及时纠偏，持续优化模型。

生成式人工智能模型的偏见引入风险防范。生成式人工智能科研评价大模型在训练数据、设定算法等环节都可能引入性别、民族、社会经济状况、语言、意识形态等偏见，以及难以觉察的潜在偏见、非意识偏见。为有效防范偏见引入，一要形成负责任开发生成式人工智能科研评价大模型的原则和共识；二要借鉴美国、欧盟等经验提供有效的偏见自查工具，引导模型开发团队全面开展偏见自查自纠；三要加强生成式人工智能模型开发监管，建立健全内外部相结合的监管体制机制；四要结合评价结果、利益相关人反馈开展元评价，形成全流程的偏见审查机制。

生成式人工智能科研评价大模型中的数据安全风险防范。生成式人工智能科研评价大模型的训练需要依托庞大的科研成果数据，若管理不当可能产生侵犯数据隐私、数据泄露等数据安全风险。为应对数据安全风险，一要构建并完善生成式人工智能科研评价大模型数据采集、处理、利用的框架、原则和标准；二要完善相关监管规范与追责法律法规；三要从技术、制度、机构等多方面入手加强生成式人工智能科研评价数据安全监管。

科研评价中合理应用生成式人工智能大模型的建议

（一）加强顶层设计，高效协同建设生成式人工智能科研评价大模型

一是在国家层面制定生成式人工智能科研评价大模型分级训练目标和差异化评价功能规划框架，在全国范围内开展有组织的大模型训练。二是在国家层面统筹打破管理权限及机构壁垒，推动社会科学研究成果数据分类分级有序接入生成式人工智能科研评价公共训练数据资源平台，推动算力资源协同共享，提高训练效率。三是牵头组织专家对生成式人工智能科研评价体系的意识形态、知识产权、偏见、歧视等风险及科学性进行审查把关。

（二）全面提升科研评价人员的知识素养、人工智能技术能力与责任意识

在知识素养方面，科研评价人员不仅要深刻理解科研评价领域的理论、原理、价值等“硬知识”，还要深化对科研评价实践的感知和思考。在技术能力方面，科研评价人员应深刻理解生成式人工智能开展科研评价的技术逻辑与局限，能够科学地为生成式人工智能布置任务，并对其生成内容进行评估、选择、优化和合理使用。在责任意识方面，对科研评价人员开展负责任地使用生成式人工智能开展科研评价相关培训，传授有效经验，强化风险意识，并提供风险自查工具箱。

（三）加强安全开发生成式人工智能科研评价大模型规范建设，完善不当使用追责法律法规

一是加快出台生成式人工智能科研评价大模型安全开发和伦理审查规范。基于已有生成式人工智能管理规范，结合科研评价的具体场景，制定具有较强可操作性的风险审查管理规范，明确评价模型安全开发的原则、指南与规范，以及评价模型的审查主体、审查程序及审查标准。二是加快制定生成式人工智能科研评价大模型不当训练与应用后果级别划分、追责标准、取证规范及相关惩处规定，并及时对接已有法律体系，及时填补法律空白。

刘彦林：人工智能时代的社会科学科研评价优化研究

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏