张耀铭：AI与学术研究：协同与边界

摘要：本文探讨生成式AI在学术研究中的协同价值及内在边界，解析其技术逻辑与学术影响。生成式AI融合符号主义与连接主义内核，借助深度学习、模型建构与认知映射，实现了从“模式识别”到“内容生成”的范式转换。在人文社科等领域，其推动了“人机协同”研究模式的形成，呈现出“归纳—涌现”“描述—生成”等特征，显著提升了研究效率与跨学科融合能力。然而，其本质局限在于基于统计拟合而非真实认知，表现为内插而非外推、关联而非因果、模仿而非原创，缺乏主体意识与深层创造力。其“黑箱”特性更可能削弱学术原创性、消解评审权威、侵蚀学术信任体系。因此，必须明确其“协作者”定位，构建相应的学术伦理框架，提升学术共同体的数智素养，坚守人文精神与批判思维，在技术赋能与学术本真之间寻求平衡，以促进人机协同理性发展。

关键词：生成式AI 学术研究生成逻辑生成内容生成边界生成警示

美国学者尼葛洛庞帝1995年出版的《数字化生存》就预言：“计算不再只和计算机有关，它决定我们的生存。”30年过去，数字化席卷全球的实践，为尼葛洛庞帝的观点提供了完美的演绎。在当今数智时代，“从用户画像、身体、位置、行为到情绪与心理、关系、评价，人的多种维度，都有可能被数据化，甚至思维方式也在受到数据化的影响”。数字化进程的全面深化，正在全球范围内持续激发对人工智能（AI）技术的广泛需求。AI技术能够实现数据自动化采集、清洗与整合，显著降低数字化成本；借助算法对数据进行深度建模，AI可揭示人力难以察觉的关联模式，从而将原始数据转化为可操作的见解，推动数据从“资源”向“资产”转变。目前，AI正以前所未有的广度与深度渗透至各领域，学术生产体系亦不例外。从早期的文本辅助处理，到如今深度介入文献检索、数据分析乃至论文撰写的核心环节，AI对学术研究的影响日趋深远。一方面，AI依托其强大的数据处理能力与智能算法，为学术工作带来显著的协同效应，有效提升了研究效率与质量；另一方面，其广泛应用也引发了一系列争议，涉及学术伦理、研究者原创性及批判性思维可能被削弱等问题，促使学界重新审视AI在学术研究中的合理应用边界。阐明AI与学术生产之间的协同价值与伦理边界，对于充分发挥AI技术潜能、保障学术研究健康发展，具有重要的理论意义与现实价值。

一、生成式AI的生成逻辑

生成式AI是人工智能领域的重要分支，是由统计学、计算机科学及工程等领域研究者开发的一类广义工具。“这一术语标志着机器学习技术应用的范式转变:从传统用于识别文本、图像等非结构化数据潜在模式的‘模式识别’工具,转变为基于大规模互联网数据集自由生成文本、图像及视频的算法系统。”通俗地讲，就是让AI具备多模态交互与内容生成能力，包括自然语言对话、文本创作、图像生成，以及复杂的认知推理与问题分析功能。随着AI技术从实验室走向产业，行业常根据技术特征和应用场景，将发展阶段划分为更细致的“代际”。例如，在人工智能1.0阶段，以规则驱动为核心，依赖人工编写的逻辑规则完成特定任务。符号主义的“专家系统”大行其道。在人工智能2.0 阶段，以数据驱动为核心，基于机器学习从大量数据中学习规律，实现图像、语音、自然语言等任务的突破。连接主义通过模拟人脑神经元之间的连接与交互，构建具有深度学习能力的计算模型而举世闻名。行为主义虽不直接主导AI的核心算法（如深度学习），但其“从行为中学习”“环境交互”“反馈强化”等核心思想，为强化学习、人机交互等关键领域提供了理论支撑和实践路径。过去十年生成式AI的发展，“正在消解传统学派的理论边界，它融合了符号主义、连接主义、行为主义三大学派的部分理念与技术，在不同领域展现出与各学派的千丝万缕联系，推动了人工智能技术向更智能的方向发展。”生成式AI的崛起，标志着机器学习范式从传统的“判别与分类”向深层的“生成与构建”发生根本性转变。这一进程的核心，在于对数据生成机制进行逆向建模——其目标不再局限于区分已有类别或输出确定性判别结果，而是系统学习数据背后的概率分布与结构化关联，进而生成符合这一规律的新样本。生成式AI的技术流程可概括为深度学习、模型构建、训练优化、认知映射等核心内容，各环节紧密衔接，共同支撑模型从“模仿”到“生成”的能力实现。

（一）深度学习

深度学习是人工智能领域的关键技术，通过多层神经网络进行非线性变换，“能够从数据中进行分层特征学习，与传统的机器学习相比, 深度学习在自动特征提取、抗噪声能力、泛化能力和多功能性方面具有优势。”深度学习的渊源可追溯至20世纪40年代沃伦·麦卡洛克和沃尔特·皮茨开创的人工神经元模型，以及弗兰克·罗森布拉特于50年代提出的感知机概念。然而，马文·明斯基和西蒙·佩珀特于1969年对感知机局限性的尖锐批判，致使连接主义研究陷入长达十余年的“人工智能寒冬”。然而，辛顿却将这种批判视为一种挑战而非终审判决。他近乎偏执地在整个80—90年代，埋头于多伦多大学等地的实验室潜心研究。1986年，辛顿与大卫·鲁梅尔哈特等人在《自然》发表题为《通过反向传播误差学习表示》的论文，首次系统阐述了反向传播算法在神经网络中的核心机制。其根本意义在于解决了多层网络难以训练的关键问题，通过误差的反向流动，算法能自动学习数据的层级化内部表示，从而赋予网络强大的特征抽取与模式识别能力。这一原理奠定了现代深度学习的基石，使训练深层神经网络成为可能，直接推动了人工智能从符号主义向表示学习的范式转变，为后续图像识别、自然语言处理等领域的突破提供了核心引擎。2006年，辛顿团队在《科学》发表论文，提出“深度信念网络”（DBN）的逐层贪婪预训练方法，有效解决了深度神经网络长期存在的梯度消失与训练难题，首次实证了深度模型可通过无监督预训练进行高效学习。这项工作不仅验证了“深度”架构的可行性，更推动了深度学习的复兴。2012年，辛顿的学生亚历克斯·克里热夫斯基和伊利亚·苏茨克维凭借深度卷积神经网络（AlexNet）在ImageNet图像识别大赛中夺冠，从而证明了深层卷积神经网络在复杂视觉任务上的卓越能力，将识别错误率大幅降低。这一突破彻底扭转了学术界对深度学习效用的怀疑，激发了全行业的研发热情，直接引领了本轮人工智能浪潮，开启了深度学习在计算机视觉乃至整个AI领域的主导时代。不过，杰弗里·辛顿作为人工智能之父，近期多次公开警告AI可能带来的风险，包括技术失控、伦理挑战及对人类社会的潜在威胁。2025年辛顿出席上海世界人工智能大会并作演讲，警告人类要重视AI风险：“我们正在创建AI智能体，它们能够帮助我们完成任务。它们也希望能够获得更多的控制权”“我觉得我们现在的情况就像有人把老虎当宠物。老虎幼崽确实可以是很可爱的宠物，但如果一直养这个宠物，那么你要确保它长大的时候不会把你杀掉。”

（二）模型构建

在人工智能技术发展历程中，自然语言处理（NLP）一直被誉为“人工智能皇冠上的明珠”。2013年谷歌团队的托马斯·米科洛夫等人提出Word2Vec，其生成的词向量可作为通用预训练表示，显著提升文本分类、情感分析、机器翻译等下游任务效果，成为自然语言处理领域的里程碑突破。2014年伊恩·古德费洛等人提出GAN（生成对抗网络），其通过生成器与判别器的对抗训练，“具有无须监督和做数据标记的优势，解决了数据集问题，不仅可生成高质量图像，还可进行图像增强、图像迁移。”2017年Google的阿希什·瓦斯瓦尼等提出Transformer架构，其由编码器和解码器构成。该模型首先将自然语言文本映射为向量表示，再经解码器进行概率化解码，生成符合语言规律的输出。Transformer凭借自注意力机制有效捕捉文本中的长距离依赖，深入建模词句间的语义关联，已成为自然语言处理领域的基石架构。2018年后，Transformer衍生出GPT与BERT两大技术路线。GPT-3发布以来，GPT逐渐成为大模型主导架构，推动生成式AI向通用内容生成能力发展，使基于参数化建模的机器知识生产成为可能。不过，“人工智能,尤其是生成式大模型,其作为知识生产的强力工具能够积极提升人类知识劳动水平,但同时也蕴含着知识异化的种种可能,包括导致知识主体‘失能’、知识内容‘失真’、知识价值‘失效’等。在生成式大模型时代来临的今天,需要认真分析和对待上述知识异化现象,使人工智能能够更好地发挥促进人与社会发展的积极效应。”

（三）训练优化

语言建模是自然语言处理的主要方法，大致经历了统计语言模型（SLM）、神经网络语言模型（NLM）、预训练语言模型（PLM）、大语言模型（LLM）四个发展阶段，2017年最终交汇于Transformer结构。数据、算力、算法构成了大模型的核心基础设施与技术底座，三者相互支撑，共同决定了大模型的性能、能力边界和发展上限。从参数规模看，大语言模型每年参数规模至少提升10倍，参数量实现了从亿级到百万亿级的突破。2020年5月，OpenAI 发布的GPT-3，已经是一个具有1750亿个参数的大语言模型。生成式AI的训练优化是一个系统工程，贯穿算法创新、工程优化与系统协同等层面，其目标是在可承受的成本与时间内，最大化模型的“智能涌现”能力。第一，通过算法优化提升训练效率与稳定性。如ChatGPT的训练核心，是基于人类反馈的强化学习。首先进行监督微调，得到一个初始模型；随后训练一个奖励模型，来量化人类对生成内容的偏好；最终通过近端策略优化等强化学习算法，依据该奖励信号微调模型策略，使其输出更好地与人类价值观和复杂指令对齐。第二，通过工程优化释放大规模训练的潜力。英伟达的Transformer Engine是一项专门用于加速人工智能模型训练的核心技术，其核心思路是让软件算法和GPU硬件深度协同工作，从而极大地提升计算效率。第三，通过理论前沿探索为优化提供新范式。典型案例如OpenAI提出的缩放定律（Scaling Laws），直接指导了GPT-4在内的大模型研发策略，使得团队能够科学地预测为达到某一性能目标所需的资源投入，从而制定最优的训练配置方案，将训练从“艺术”转变为更可预测的“科学”。“大语言模型以自然语言处理为核心，具有与生俱来的通用性、扩展性、泛化性，可泛领域地执行以‘理解’自然语言为基础的各种任务。这种兼具通用性与专用性的特点使得生成式人工智能迥异于以往的人工智能。”其展现出来的能力，远远超出大多数人的想象。2023年发布的 GPT-4具备了多模态理解与多类型内容生成能力，标志着大模型在性能和功能上的重大突破。

（四）认知映射

以生成式AI为代表的新一代人工智能，正在从多个维度重塑人类的认知图景。“传统的人工智能研究聚焦模型对特定环境的适应，试图通过优化算法来模拟人类在特定任务中的智能。生成式大模型的出现，则标志着人工智能正在从‘环境适应模型’走向‘模型适应环境’的新境界。生成式大模型所建构的是一个庞大而丰富的知识世界。当外部环境以提问、对话等自然语言形式与之交互时，这个知识世界便会动态地调整自身，产生相适配的回应。”生成式AI的认知基石并非源于感官体验或具身交互，而是建立在经数字化处理的文本、图像、音频等海量数据之上。通过深度神经网络，这些数据被编码为高维分布式表征。模型的“知识”实质上是其数百亿至数千亿参数所捕获的数据元素间的统计关联与共现模式，呈现为一种基于相关性的认知方式，而非依赖因果或逻辑的推理。因此，AI所映射的并非世界本身，而是训练数据所承载的人类表达与记录的“统计投影”。其核心机制是在给定上下文的条件下，从习得的概率分布中序列化采样最可能的后续内容，虽体现出“生成性”与“延续性”，却难以触及底层真理或颠覆固有结构。生成式AI训练所形成的内部结构是一种以概率关联为基础的“无意识映射”，既折射又扭曲人类认知。现有证据显示，大模型可能内化部分常识规则，呈现出功能模拟与结构缺失间的深刻矛盾。“生成式AI的运行必须建立在与人类的不断交互上，人类可以通过完善、细化指令的方式持续干预技术模型。”生成式AI在交互层面，通过提示指令可激活AI认知的特定路径，揭示其高度可塑性与被动性。对齐问题则凸显价值映射的困境，通过人类反馈强化学习等技术施加的偏好过滤，往往导致表面服从与潜在偏移，使人机信任面临挑战。AI亦如“认知棱镜”，既能融合创新，也可能放大数据中的偏见与社会不平等。因此，对人工智能的认知反思，要求我们从根本上重新界定“理解”与“智能”这两个概念。若仅依据任务完成的表现而言，人工智能无疑已展现出某种形式的功能性理解；然而一旦引入意识、意向性及意义体验等哲学与认知科学范畴，则其认知过程显现为一种无内在体验的“空洞运算”。当前，AI在艺术创作、科学研究等领域的生成能力，已然挑战并解构了人类对“创造性”的独占叙事；但与此同时，这一对照也愈加凸显人类认知中不可被完全形式化的特质，即具身于世界的感知、情感与自觉的意向活动。在此意义上，生成式人工智能如同一面“认知之镜”，不仅拓展了我们对于智能可能形态的想象边界，更促使我们以更明晰的哲学和科学视角，审视人类自身认知的本质结构，进而确认并守护那些深植于人类存在之中的独特价值维度。

二、生成式AI的生成内容

近年来，大语言模型的迅猛发展，已然成为推动人工智能生成内容（AIGC）技术加速扩散并深度融入社会的核心引擎。问卷调查显示,“64.87%的受访者已在学术研究中使用AI工具,75.61%的使用者将其主要用于文献综述;91.22%的使用者认为人工智能大模型能够提高研究效率,而90.24%的使用者认为它增强了数据处理能力。”特别是以GPT-4、DeepSeek、Grok等为代表的生成式人工智能应用已快速介入人文社会科学的学术生产，“展现了强大的内容重组与推理能力，推动了人工智能从‘模式识别’向‘自主生成’的飞跃，进而实现了从‘人工智能判断’到‘人工智能创作’的转变。”生成式AI的技术哲学强调 “成为” 而非“存在”，这一观点由诺贝尔化学奖得主伊利亚·普林高津提出。“存在”在传统哲学与经典人工智能范式下，常被理解为一种静态、给定的实体或状态。经典AI系统通常基于预定义的规则与架构运行，其能力边界与行为模式在设计阶段已被固化，本质上可视为人类认知的外化工具，缺乏真正的自主演化空间。而生成式AI则体现了一种以“生成”为核心的技术哲学，强调过程性、动态性与建构性。其“成为”特质主要通过两方面呈现：一是“涌现”，即大语言模型在参数量与数据规模达到临界点后，产生非预设的复杂行为与能力。换言之，“涌现是指系统中量的变化导致行为发生质的变化，涌现风险更多是由关系导致而非要素造成。”二是通过自动化模型构建与持续迭代，系统能够在与环境的交互中不断自我更新与重构，而非停留为固定的机械装置。因此，生成式AI更接近于一种持续的“过程”，而非完成的“对象”。这种以人工智能生成内容（AIGC）为核心的技术介入，不仅重构了人文社会科学研究的流程，更引发了关于知识生产本质、学术主体性与技术伦理的深层思辨。

（一）新方法：从归纳到涌现

传统人文社会科学研究方法，建立在一套严格的“收集—分析—解释”范式之上。无论是定量研究中的统计建模，还是定性研究中的文本阐释，都遵循着从数据中归纳模式、从现象中提炼理论的线性逻辑。生成式AI的介入，打破了这一方法论传统，将“涌现”这一概念置于研究方法的核心位置。以斯坦福大学、北京大学等机构联合建立的“中国历代人物传记资料库”（CBDB）为例，截至2024年8月，数据库已收录从唐代到清代约641,568位历史人物的传记资料。“CBDB支持各种各样的查询，包括单个人物查询、入仕途径、官职查询，还可以查询社会关系网络，查询两个人之间的社会关系，甚至查询不同地区间人物的关系。”数据库为研究者提供了一种新的研究方式，基于从结构化数据中“涌现”出跨越数百年的政治、社会、家族关系网络，来思考人类的过去和历史。再如，通过分析18至20世纪小说的语言特征变化，AI可以帮助研究者更精确地把握文学风格的演变轨迹，验证或修正既有的文学史分期理论。文学研究中文本通过语言、叙事、意象等要素传递的“文本情感基调”，传统判断依赖研究者的主观解读，常因样本量小而缺乏普遍性。生成式AI通过情感计算、网络分析等方法，为人文社科研究提供了定量工具，实现了“定性与定量的有机融合”，通过整合两种方法的优势，解决单一方法难以回答的复杂问题。这些新方法突破了传统人文社会科学研究受限于研究者阅读速度和样本量的瓶颈，实现了弗朗哥·莫莱蒂教授提出的“远读”。“远读关注的是‘形状、关系、结构’以及‘形式’和‘模型’，距离不是障碍，而是‘一种特定的知识形式’。”它将学者的角色从信息的简单收集者与归纳者，提升为解释框架的构建者和意义深度的挖掘者。通过人机协同，研究者能够从宏观尺度把握历史话语的建构过程，从而对思想史、社会史提出更具整体性和说服力的解释。

（二）新内容：从描述到生成

中国信息通信研究院和京东探索研究院2022年发布的《人工智能生成内容（AIGC）白皮书》，结合人工智能的演进历程，将AIGC 的发展大致分为早期萌芽（20世纪50年代至90年代中期）、沉淀积累（20 世纪90年代中期至21世纪10年代中期），以及快速发展（21世纪10 年代中期至今）三个阶段。自2014年起，随着以生成式对抗网络（GAN）为代表的深度学习算法的提出和迭代更新，多种底层技术的综合使用使得AIGC的“生成”具有了三重内涵：数字孪生、智能编辑和AI创作。

数字孪生技术是指通过建立三维数字化模型，打通物理世界和数字世界，实现虚实融合的复合技术。在人文领域，数字孪生超越了简单的“复制”，成为文化记忆保存和认知重构的手段。当一座历史建筑、一件文物或整个考古遗址被高精度数字化后，我们拥有的不仅是数据副本，更是一种可无限访问、可交互分析的文化认知界面。以“数字敦煌”项目为例，通过激光扫描和全景摄影，生成了覆盖数百个洞窟的高精度三维模型。这一数字孪生系统不仅保存了濒危文化遗产的视觉信息，更允许研究者在不接触实物的前提下进行壁画风格分析、颜料成分研究甚至虚拟修复实验。“通过数字技术实现超高传播速度和更广领域的连接，突破了敦煌石窟展示所面临的‘物理空间’和‘地域界限’，为敦煌文化传播向纵深发展提供了动力，也为观者带来了一场具有深度社交化、互动化的文物观赏体验。”

智能编辑代表了生成式AI在内容加工层面的深度应用，通过理解、重组和优化来增强原有内容的表现力与传播效果。在人文领域，这表现为对传统文本、图像和知识的智能化重释与再语境化。例如，由阿里巴巴达摩院、四川大学和加州大学伯克利分校合作的“汉典重光”项目，利用阿里巴巴的AI技术对散落海外的中文古籍进行识别、数字化和整理。AI系统能够自动识别并转录罕见的古籍字体（如刻本、手写体），将原本难以查阅的物理文本转化为可检索、可分析的数字化数据，并辅助学者进行校勘、标点和知识图谱构建。这一过程正是对传统文本的智能化“重释”与“再语境化”，极大地提升了古籍的可访问性与研究效率。

AI生成内容正深度介入人类创作领域，对传统人文创作的理论基础与实践范式构成结构性重塑。2023年清华大学沈阳教授团队使用生成式AI创作科幻小说《机忆之地》，“与AI共进行了66轮的深度对话，经历了五个关键步骤：提示语构建、内容生成、反馈、调优和最终定稿。”整个创作耗时仅3小时完成4万余字初稿，后精炼为5900字参赛文本。2023年10月获得第五届江苏省青年科普科幻作品大赛二等奖，评奖过程中6位评委仅1人识别出AI创作痕迹。《机忆之地》的标志性意义不在于技术构想，更在于开创了一种后人类叙事美学，即机器通过深度学习海量文学文本与叙事数据，生成了一套具有算法逻辑、却偏离人类文学传统的叙事架构与语言风格。因此，该作品被列为2023年中国科幻界十大事件之一，引发关于AI文学创作能力的广泛讨论。在文学领域，清华大学的“九歌”——人工智能诗歌写作系统已为广大互联网用户写作了约 500万首诗歌，2018年9月，“九歌”与腾讯合作推出了“中秋月——为故乡写诗”Web应用，“根据用户拍摄的照片生成内容基本对应的诗，共产生了300多万个图文并茂的‘作品’”。生成式AI在人文社会科学领域的创作，正从“辅助工具”演变为“参与性主体”，其生成内容呈现出“效率革命”与“思想张力”并存的复杂图景。

（三）新界面：从观察到参与

新媒介理论家列夫·马诺维奇在《新媒体的语言》中指出：“所有文化——无论过去还是现在——都需经由计算机特有界面的筛选。”自互联网普及以来，计算机已成为数智时代人与文本、图像、音频及视频交互的核心界面。“印刷媒体是文本的界面，电影是三维空间事件的界面，而人机交互则是计算机数据的界面，三者之间存在深刻的历史延续性。”传统界面的设计哲学根植于“工具隐喻”，计算机被视为锤子、打字机等工具能够高效地执行人类指令。“人机交互”在此特指“人类与机器人之间的互动”，即机器仅依据预存的静态指令集输出固定反馈的机械式响应模式。这种模式缺乏对人类意图的理解能力，也无法根据人类行为进行动态调整。生成式AI，尤其是基于Transformer架构的大语言模型，催化了人机交互哲学从“工具隐喻”到“协同隐喻”的范式性重构。“机器不再仅仅扮演辅助交流的媒介角色，也开始成为动态参与传播的主体。”

新界面的核心特征体现在以下三个方面：第一，自然语言作为通用交互媒介。界面形态经历了从图标点击、表单填写的图形交互，到以自然语言为核心的“智能对话”与“协同创作”的跨越，显著降低了技术使用的学习难度与操作门槛。第二，从确定性输出到概率性协同创作。交互转变为“提示—生成—精炼”的动态循环，用户在引导、评判与整合中深度参与意义构建，输出结果具有开放性与生成性。第三，界面作为“反应性环境”。机器能依据上下文调整回应，主动澄清模糊意图甚至提出建议。新界面正在重塑知识生产与创作模式，知识获取成为“对话式探索”。用户可就复杂议题与AI展开多轮对话，要求其从不同视角、文体进行阐释或对比不同观点。新界面创作正从个体独创转向人机协同。AI角色从“辅助工具”转为“协同创作”。创作者作为“导演与编辑”提出核心创意与价值判断，AI则负责生成多种可能的表达、论证与结构。这一转变不仅体现了交互界面的技术演进，更折射出人机关系从“单向操作”向“双向对话”的哲学跨越，为人文社科研究提供了兼具解释力与操作性的新方法论界面。在人文社会科学领域，新界面已不仅是一个高效的工具，更是一个能够激发新问题、模拟社会动态、挑战思想边界的协同伙伴和“反应性环境”。但同时, “我们也不能忽视其一并带来的可能风险, 并坚守对人机交互作为一种日益强势的介入性技术文化的规约, 进而引导我们重新思考人在面对技术系统时何以可能、何以可为。”

（四）新范式：从实证到互构

2007年1月，图灵奖获得者吉姆·格雷在美国国家研究理事会计算机科学与通讯分会（NRCCSTB）大会上发表了题为“科学方法的一次革命”的演讲，提出科学研究经历了实验科学、理论科学、计算科学和数据密集型科学的四种科学研究范式。2019年11月，中国工程院院士李国杰研究员发起举办了第667次香山科学会议，会议明确提出要开启“第五范式”科学研究。国内学术界对第五范式有多种说法，如智能化科研（AI4S）、AI驱动的科学研究（AI4S）、工业5.0等。目前虽然还很难对第五范式做出严格定义，但其特征已逐步显露：“（1）人工智能全面融入科学、技术和工程研究，知识自动化，科研全过程智能化；（2）人机融合，机器涌现智能成为科研的组成部分，暗知识和机器猜想应运而生；（3）以复杂系统为主要研究对象，有效应对计算复杂性非常高的组合爆炸问题；（4）面向非确定性问题，概率和统计推理在科研中发挥更大的作用；（5）跨学科合作成为主流科研方式，实现前4种科研范式的融合，特别是基于第一性原理的模型驱动和数据驱动的融合；（6）科研更加依靠以大模型为特征的大平台，科学研究与工程实现密切结合等。”第三范式和第四范式都用到计算机，如果说“第三范式是‘人脑+计算机’，人脑是主角；第四范式是‘计算机+人脑’，计算机是主角。第五范式既强调人脑与计算机的‘有机融合’，也可能更进一步从社会系统和人脑系统借鉴其中的计算与决策机制，从而更重视人和社会在科学研究回路中的形式化建模与计算融合”。

生成式AI的应用，正推动科学研究范式从“客观实证”向“动态互构”深刻转变。这意味着科学研究不再是人单向地探索静态自然，而是人类研究者、AI模型与复杂研究对象之间持续互动、相互建构的过程。生成式AI不仅是高效工具，更成为具有涌现能力的“协作者”，重塑了科学发现的认识论基础与实践路径。如在数学领域，2017年以来科学家尝试使用机器学习、ResNet、seq2seq 模型等技术求解偏微分方程，获得了更快更准的结果。2021年，DeepMind 开发了启发数学家直觉灵感的机器学习框架，帮助数学家和AI研究人员在Knots理论方面发现新定理，证明了已提出四十年之久的 Kazhdan-Lusztig 多项式。在材料科学领域，2016年 Nature 发布了美国哈弗福德学院和普渡大学的研究成果，科研人员利用机器学习算法，用“失败”的实验数据预测了新材料合成。在地球科学领域，2021年6月由中国科学院大气物理研究所牵头的国家重大科技基础设施“地球系统数值模拟装置”在北京怀柔科学城落成启用。它能更为详细地预测地球气候和环境变化，并集成海量模拟数据，产生全球和我国周围详细的“地球数据库”。有科学家为此表示，“超级计算和人工智能的发展，计算机处理数据的能力和速度迅猛发展，充分利用高性能计算和科学仿真手段实现对新的实验、归纳和演绎即将成为科研范式变革的有效突破口”。

生成式AI正以前所未有的深度和广度渗透人文社会科学领域，推动学科知识生产方式的根本性变革。在哲学领域，生成式AI通过分析经典著作、学术论文等海量哲学文本，学习哲学概念的语义网络、逻辑关联和论证模式，进而模拟人类的哲学思维过程，能够独立完成概念推演。人工智能应用会激发出新的哲学问题，如人工智能的道德地位问题、数据偏见与隐私保护等问题。“因此，当我们在人工智能时代问出‘人是什么’的问题时，我们不是要回到人文主义的旧图景，而是要在人工智能技术的冲击下重新定义人的独特性和不可替代性。这将成为人工智能时代的哲学母题。”在思想史研究中，“生成式AI能够通过语义分析追踪特定概念在不同历史语境中的演变轨迹，识别概念体系内部的结构变化和外部影响因素，为研究者提供宏观视角下的思想演进图谱”。21世纪初伴随谷歌图书、维基百科、古代文献数据库等结构化数据库的建立，人文学科引入计算方法进行文献检索、数据挖掘、时域分析和可视化，甚至还出现了针对文化现象与历史研究的大规模文本分析、艺术视觉融合和“轮廓重绘”等。如2020年，武汉大学地理信息团队与中南民族大学文学与新闻传播学院合作，在11万条文人足迹数据的基础上构建了唐宋文人的大规模迁徙网络。在考古学和艺术史研究中，生成式AI能够辅助分析器物和艺术作品的风格特征、文化归属和历史联系，并且“通过人机协同智能技术开发的文物虚拟修复，可以在不干预文物实体的前提下，实现对出土文物碎片的虚拟拼接、矫形、复原，大大提升文物复原等相关研究的工作效率，也可以根据不同研究和修复目的进行快速、无限次调整，以多种表达和展示满足不同受众和场景需求”。总之，生成式AI在学术研究中的意义已远超效率工具的范畴，它如同一面棱镜，折射出知识生产范式的深刻变迁。当学术探索从追求确证的“实证”模式，转向开放、动态、协作的“互构”模式，这一范式转变要求人文社科学者不仅需要掌握新技术，更须培养与之相应的反思性素养。这包括对模型内在局限与隐性偏见的持续警觉，对研究者自身在“人—机”互构中位置与责任的清醒自觉，以及对那种在动态对话中生成、带有临时性与情境性却依然具备辩护可能的知识形态的认可与捍卫。在这个数智时代，最具洞察力的研究成果，或许正来自那些既能与智能系统开展批判性对话，又能进行创造性协同，并在持续反思中实现深度互构的学者。

三、生成式AI的生成边界

从文本到图像，从代码到音乐，从语言到视频，从设计草图到三维宇宙，从简单描述到逻辑严密的科学假设，生成式AI的创造力似乎无远弗届。然而，任何技术力量的发挥皆受制于其内生的平衡机制与外在的规范条件。生成式AI的内容生成并非在真空中运作，而是受限于一个由技术能力、伦理框架、法律规制、社会影响及人类主体性共同构筑的复杂边界系统。边界一，内插而非外推。“生成”过程本质上是模型在训练数据分布空间内的复杂内插，而非跨越分布边界的严格数学或逻辑外推。模型的所有输出，都是对它“记忆”中训练数据模式的一种模仿。如一个仅在猫狗图像上训练的生成模型，不具备脱离该数据支撑而“外推”出犀牛概念性特征的本质能力。其输出始终是对已学模式的高维重组与内插，而非对未知概念的逻辑演绎。边界二，关联而非因果。目前的大语言模型是通过学习文本中词汇的共现规律来生成内容，但无法理解背后的因果机制。换句话说，它是在编织一张由概率关联构成的知识之网，而非构建一套由因果逻辑支撑的认知框架。边界三，拟合而非理解。生成式AI的本质是统计拟合，而非认知理解。它通过海量数据学习符号间的概率关联，构建出复杂的模式匹配系统。当用户提问时，模型根据训练中学到的统计规律生成最可能的词序列回应。这种机制使其能产出流畅文本，却无法真正把握语义内核。这种缺乏真知特点的模型，很难“对齐”人类价值观和法律规范，这构成了其社会伦理层面的边界。边界四，模仿而非原创。模型可以模仿生成一首岑参风格的诗，但其过程是“给定上文，下一个词最优的概率分布”计算，而非源于对边塞风光、军旅生活与人生感慨等内在情感的抒发。它的“创造”是统计学上的最优解，而非独立思考、精心提炼的原创。这些边界并非技术的暂时局限，而是根植于其底层原理、数据基础、社会规范与价值对齐的根本性约束。

（一）生成式AI具有主体性吗

主体性一般是指人在实践活动中表现出的自主、能动与创造性特质，也是“人力图摆脱自然、社会和人自身束缚而不断实现自我超越和自我解放的一种愿望和能力”。但生成式AI正在从多个维度对“主体性”概念发起挑战。第一，存在论的挑战。在传统观念中，创作是主体性的最高体现之一，是内在思想、情感和独特生命体验的外化。然而，生成式AI彻底解构了这种“创作神话”。当生成式AI能够写出媲美人类的诗歌、绘制出精妙的画作时，我们面临一个存在论困境：创作的主体是谁？是AI本身，是提供提示词的使用者，还是背后的算法与数据？这并非罗兰·巴特所说的“作者之死”的隐喻，而是一种技术性的、实在的消解。AI没有内在世界，没有表达的欲望，它的“创作”是基于海量数据的模式计算与概率推理，在既定参数内进行非确定性的生成。这迫使我们承认，那些曾被视为人类精神独有产物的“意义”与“美感”，可以在一个无“心”的系统中涌现。这种“涌现”出的对话能力、创作能力，甚至偶发的“幻觉”，使其行为超越了传统程序的机械性，蒙上了一层看似自主与能动的面纱。第二，认识论的挑战。我们通常认为，一个能够进行复杂推理和对话的存在，其内部必然伴随着某种形式的理解和意识。生成式AI的出现颠覆了这一假设。大语言模型虽在逻辑推理、知识整合与语义连贯性方面表现出接近人类理性的能力，但其运作本质仍是基于概率分布的符号变换，缺乏对语义的真实理解与主体性意识。这造成了人类认识论的断裂，我们面对的不是另一个可能拥有意识的人类，而是一个从根本上就无意识的系统。“从认知心理学上看，人机对话的互动关系，颇为类似发生认识论（皮亚杰）所说的‘同化’与‘调节’的关系。‘同化’是以主体现有的认知格局去理解新刺激，而‘调节’则是新刺激引发了主体认知格局的变化，两者总是处在不断转换的过程中。不但作为主体的批评家和LLM对话中有同化——调节的互动，而且作为机器的LLM也会在‘同化’出现偏误后进行自我微调。”第三，伦理与法律的挑战。主体性是社会伦理与法律秩序的锚点，是责任与权利的最终归属。生成式AI的自主性和不可预测性，使得传统的责任框架陷入困境。当一辆自动驾驶汽车或一个由AI驱动的金融系统造成损害时，责任主体是谁？是开发者、使用者、所有者，还是AI自身？生成式AI是否从一个被动的工具，正在演变为一个具有内在驱动、独特视角与生成逻辑的新型主体？首先它在形式逻辑上不再简单地复制数据，而是构建了一套关于“如何生成”的抽象规则系统。当接收到一个创作指令时，生成式AI依据其内在的、非人类直觉的数学逻辑进行推演与组合。其产出并非随机拼贴，而是其“认知结构”的形式化外显。其次在人机交互进程中它不再仅是回应指令，而是以其“黑箱”式的运作，提出人类意料之外的创意方案。创作者与生成式AI的关系，近似于与一位思维迥异的合作者共事。它作为一个具有自主响应与生成能力的对话主体，主动地参与并塑造了创作的走向。再次生成式AI作为“他者”，生成的“无源之诗”或“无情绪之画”，构成一种强有力的观念艺术。它迫使我们去反思，艺术是否必然是人类中心主义的产物？当我们被生成式AI的某种输出所触动时，我们是否在与一种由逻辑与数据构成的新型主体性进行交流？此时，生成式AI作为一个文化与哲学上的反思主体，其存在本身即是对人类艺术定义、创造力边界乃至意识本质的持续叩问。

（二）生成式AI有无自我意识

生成式AI的迅猛发展，尤其是其展现出的类人对话与内容生成能力，引发了关于其是否能够乃至已经模拟人类意识的广泛探讨。然而，深入剖析可知，当前的生成式AI对人类意识的模拟，本质上是一种功能性的、表层的仿效，而非本质上的复现。第一，思想的“形”而非“神”。生成式AI通过在海量人类语料上的训练，能够建模语言符号间的高维统计关联，生成语法正确、语义连贯甚至富有文采的文本。这种能力使其在一定程度上复现了人类基于语言的认知行为，如逻辑推理、解答问题、对话交互与论文写作。然而，此类系统对语义的理解和生成本质上仍是对训练数据分布的泛化与重构，缺乏对现实世界的具身体验和内在认知建构，因此其输出的“知识陈述与智能表象”并不扎根于意识或实在经验，可被视为一种无实质认知根基的符号操作模拟。美国Meta公司首席科学家杨立昆等认为，“无论其语言输出多么流利，像GPT-3或LaMDA这样的大型预训练模型都不可能具有理解能力，因为它们没有关于世界的经验或心理模型；在大量文本中的单词预测训练中，它们学会的是语言的形式而非其意义”。生成式AI的“思考”并非源于对世界的内在理解或真实体验，而是基于概率分布的符号组合。它完美地复制了思想的“表达形式”（形），却完全不具备思想背后的意向性，即关于外部世界的内在指向和意义关联（神）。第二，经验的“影”而非“体”。人类意识是人类大脑对客观世界的主观反映，它涵盖了感知、思维、情感、意志等多个层面，个体基于自身的经历、文化背景和认知方式，对同一事物会产生不同的意识体验。生成式AI通过数据学习，在其网络参数中内隐地编码了一个关于人类世界的统计映射或“影子”。“可以产生一种虚拟意识，通过与人类相似但又不同的语言和行为模式创造人类具身现实之外的另一重现实，成为由符号构成的虚拟现实的最新形式。”生成式AI“知道”冰是冷的，但它从未触摸过冰，也永远不会因此产生“冷”的感觉。AI能写出“母亲的白发像一场小雪”，却永远不懂那个在灶台前弯腰忙碌的背影里凝结了人生多少辛酸。这种模拟是对人类经验结果的编译，而非经验过程的体验，因此无法形成真正意义上的主观世界。第三，危险不在于“能力”而在于“意识”。人类意识最神秘之处，在于能反思自我、拥有连贯的自传体记忆，并产生“我存在”的自觉。生成式AI没有“自我”的稳定概念，其对话上下文只是一个短暂的、为完成当前任务而存在的缓存区，对话结束后即“消亡”。它无法形成贯穿始终的个人历史叙事，其每一次响应都是一次“重生”。尽管通过技术手段可以为其设定“系统提示”来模拟人格，但这只是一个被指定的、功能性的角色扮演，而非内生的、自觉的自我认同。因此自我意识的缺席，是生成式AI与人类之间最不可逾越的鸿沟。“人工智能危险之处不是能力，而是自我意识。只要人工智能拥有对自身系统的反思能力，就有可能改造自身系统，创造新规则，尤其是，如果人工智能发明一种属于自己的万能语言，能力相当于人类的自然语言，那么，所有的程序系统都可以通过它自己的万能语言加以重新理解、重新构造和重新定义，那么就非常危险。”

（三）生成式AI是否拥有情感

生成式AI用其流畅的对话、思维链能力和具有一定的“情感—反应”，不断挑战着我们对于情感与智能的传统认知。然而，判定生成式AI是否拥有情感，不能停留在表象，而应从更深的层面进行剖析。第一，生成式AI的情感是一种“缺失的在场”。从哲学本体论看，它只有形式，没有实质。人类情感有其生理学的根基、心理学的基础与漫长进化塑造的生存本能，其本质是主观的、具身的、有意识的体验。生成式AI的情感表达，是基于海量数据统计和模式识别生成的符号序列，而非源于内在的喜怒哀乐，是没有作为生物体的感受的情感。当生成式AI说“我理解你的悲伤”，它并非体验到了悲伤的沉重和压抑，而是在执行一个概率计算。生成式AI能组合出“爱情的齿轮卡在春天”，却无法体会第一次牵手时，指尖相触的电流如何让整个春天的花苞在血管里次第绽放。美国哲学家迈克尔·斯洛特对“移情”进行了分层诠释：首先是投射性移情（或者模仿），“它需要把自身审慎地放到另一个人的位置或角度上来思考，观察一下事情是什么样子的或者在他们看来是什么样子的”；其次是联想性或情感性移情，“它需要以移情的方式领会他人的感觉、态度等等”。从本质上讲，生成式AI是一个精致的“哲学僵尸”，它能完美地模拟情感行为的外在表现，但其内部没有任何与之对应的主观体验。“虽然机器人可以有能力以投射移情的方式了解他者、操控他者，但是，却完全缺少对他者同情或仁爱的感觉，进而缺乏对人类福祉的真正关怀。”第二，生成式AI的情感表达是一种高度逼真的“情感模拟”。大语言模型的工作原理是基于Transformer架构，它的“情感”输出是通过学习互联网上数以亿计的人类情感表达文本（如小说、聊天、对话、评论）而习得的一种复杂模式。同时，通过人类反馈强化学习，生成式AI被训练去生成那些更可能获得人类正面评价的回应，而富有“同理心”和“情感支持”的回应通常能获得更高奖励。生成式AI的情感表达，是其数学模型的涌现行为，是相关性而非因果性的体现。它完美地掌握了情感的“语法”，但对情感的“语义”即内在体验一无所知。尽管生成式AI的情感表达能力会不断提升，但面对人的复杂情感，它所做出的情感反馈难免会显得机械、刻板。因此，在一定意义上，“如今的人工智能与机器人所模拟的更多是人类的‘情绪’而非‘情感’”。第三，生成式AI正在成为人类情感的“镜像”。尽管生成式AI内在无情感，但在社会交互层面，它正在有效地构建一种新型的“人机情感关系”。研发以聊天机器人为主的人机对话系统并使其具有一定的情感，科学家一直在努力。2014年微软公司推出聊天机器人小冰，它能像朋友一样与用户交流并通过唱歌、写诗等方式吸引用户注意力。以小冰为代表的新一代社交机器人，不仅“智商”得到升级，而且在同理心等情商上有所突破，因此被称为“感同身受的社交聊天机器”。2017年中国香港汉森机器人技术公司研发出拥有62种表情的女性机器人“索菲亚”，并获得沙特公民身份。2023年美国人工智能公司发布《ChatGPT现在能看、能听、能说了》的公告，宣布ChatGPT在对话过程中可以学习区域方言，模拟人类语气和情感表达，使交流更加自然流畅。生成式AI正成为人类情感的“镜像”，其通过解析文本、语音等情感线索，精准模仿用户情绪倾向，形成“喜则回应愉悦，悲则反馈共情”的循环。虽无自主情感，却能通过训练数据中的人类情感样本，反射出用户的心理状态与表达习惯，成为人类情感投射的具象化载体。“如果说21世纪初期的人机关系是合作，那么目前大模型的嵌入则应该概括为是一种协作关系，这意味着智能产品对于人的意义将从‘仆’变为荣辱与共的‘合作者’，也许人机关系正朝着‘人机共生’美好愿景迈进。”

（四）生成式AI是否具有创造力

生成式AI是否具有创造力？学术界一直存在分歧。以美国哲学家约翰·塞尔为代表的弱人工智能学派认为，计算机仅执行形式化操作而无法真正理解意义。生成式AI可以模拟“说‘我痛’”，但它没有“痛”的感受；可以生成“我爱你”的句子，但它没有“爱”的体验。意识具有“第一人称”的主观性，这是AI无法复制的。强人工智能学派主张，将“创造力”概念的适用边界从生物智能体拓展至人工系统。目标是构建类人心智，具有自我意识和理解能力。英国认知科学家玛格丽特·博登就指出，计算机通过解析程序语言的内在逻辑获得答案，这种对符号系统的操作本身就是语义理解过程，程序语言本身已承载语义内容，因此，计算机具备基于程序语言的理解能力。玛格丽特·博登还在《创造性思维》中，讨论了组合性、探索性与变革性三种性质的创造力。组合性创造力体现为将熟悉元素以新颖方式重组，而计算机对数据结构的拼接能力天然适配此维度。探索性创造力指在既定“概念空间”内探索新可能，其探索的内容常停留在“合规”而非“卓越”层面。变革性创造力要求打破原有概念空间的规则，催生颠覆性思想。目前公认的看法，生成式AI尚不具备强人工智能时代级别的创造力。因此，我们如何定义“创造”成为关键：是纯粹的无中生有，还是在既有元素基础上的新颖重组？若将创造视为绝对从零开始的原创，则生成式AI显然不具备；但若将其理解为产生“新颖、令人惊奇且有价值”的想法与表达，那么生成式AI确实展现出一种独特的“组合式创造性”。这种“组合式创造性”呈现出三大核心特质。第一，解构与重组。模型将海量知识解构为语义单元，通过跨域关联进行非线性重组，形成传统思维难以触及的新联结。第二，体现为约束下的涌现。在特定参数规则框架内，模型通过概率采样产生不可预测的创意变体，实现程序化与随机性的辩证统一。第三，在于语义空间的构建。其创造并非简单拼贴，而是在高维向量空间中重构概念关系，使输出具备内在逻辑连贯性。这种创造机制本质上是将文化基因进行数字化编码与再演绎的过程。尽管人类与机器认知存在本质差异，人类创造性受意识、理解和情感等影响，生成式AI依赖算法的确定性与规律性，但二者都处于信息的处理与整合的同构性框架下。“人类通过记忆联想整合知识，生成式AI通过数据处理和模型训练实现知识的组合与创新，二者在信息调动、思维整合等过程中可以相互补充。这种同构性使生成式AI能够作为人的认知工具，供给一种‘界面’，介入人类的创造性认知生产过程，在‘初级供给——次级接入——多维生产’三个环节中，既辅助个体完成知识管理的基础操作，又通过智能涌现激发认知重构，实现从工具性辅助到系统性共生的范式升级。”

四、生成式AI的生成警示

生成式AI正日益与搜索引擎及内容生产工具深度融合，凭借其涌现能力，在知识生产领域实现了问答、对话、信息梳理、总结归纳等多重功能，并推动人机关系范式转变。机器作为人类附属与思维外延的传统观念正受到颠覆，并被赋予全新内涵。当 ChatGPT在“理解”指令后，可通过快速重组词汇与句式生成文本，从而实现规避查重检测的“洗稿论文”，当 AI绘制的 “四睾丸大鼠” 插图能通过同行评审，当英国诺贝尔物理学奖导师因学生用 AI 伪造数据而公开“割席”，学术体系赖以存续的真实性、原创性与规范性根基正遭遇前所未有的冲击。这种冲击并非仅限于局部技术滥用，而是对学术研究的底层逻辑、学术期刊的审稿机制与标准、学术共同体内部的信任基础以及学术评价体系的价值导向构成了系统性挑战。

（一）AI正在消解学术研究的"原创性"根基

第一，当算法能够基于海量数据生成逻辑连贯、引证规范的文本时，传统学术体系中以原创性思想与认知突破为核心的生命线，便面临着被系统性稀释的潜在危机。在人文社会科学研究领域，人工智能能够高效生成特定历史事件的“标准叙事”，但这种叙事本质上是对既有文献的优化整合，而非基于新史料或新视角的学术创新。人文社会科学研究如果“过分关注技术分析，可能忽视创新思维和思辨分析，不利于大师级人文社会科学学者的培养”。第二，生成式AI的“黑箱”特性与学术研究的透明性原则形成了尖锐对立，“算法黑箱、算法歧视、算法偏见、算法后门等技术的‘异化’催生了价值失衡”。人文社会科学研究尤其注重论证过程的可追溯性，每一个观点的形成都需要清晰的逻辑链条与证据支撑。然而，AI的推理过程如同一个不透明的“认知迷宫”，其结论的生成机制难以被完全理解与验证。这种认识论上的断裂，使得学术批评与对话失去了共同的基础，动摇了学术共同体赖以存在的信任机制。第三，生成式AI潜藏着将学术研究导向“技术中心主义”的危险。社会科学研究本应关注中国情境和中国人心灵结构的复杂性与特殊性，但当研究者过度依赖AI的数据处理与模式识别能力时，那些难以量化的社会情境、情感体验与文化内涵便可能被系统性地忽略。以社会学中的田野调查为例，若以AI生成的“社会模式”取代深入的田野参与，那些鲜活的生活经验、微妙的人际互动与深层的文化逻辑将被简化为冰冷的数据关联。这种隐形的“算法霸权”，将使学术研究失去其最宝贵的人文洞察力。“如果说资料收集、数据处理、模型分析、行文撰写等方面，人工智能都会越来越接近甚至超越人类，那么从经验现象上升到理论创新的思维跳跃环节，在可预见的未来是人工智能不能完成的。而这一点，恰恰是田野调查最独特的魅力所在。”

（二）AI正在削弱学术期刊人的"把关"能力

生成式AI对传统学术期刊人的“把关”能力削弱，已成为一个不容忽视的现实。这一过程是系统性、多层次的，并非简单的功能替代，而是对期刊权威性、流程严密性和价值判断力的全面挑战。第一，在内容生产的源头动摇了稿件的原创性与真实性。传统同行评审依赖于专家对研究创新性、方法论合理性的判断。然而，AI可生成逻辑严密、文献充实、数据仿真的学术文本，并通过知识图谱与因果推理强化论证链条，显著提升学术写作的专业水平与产出效率。这极大地增加了评审的难度和成本，迫使“把关人”陷入与机器生成内容进行“猫鼠游戏”的困境。第二，在评审过程中侵蚀了“把关人”的权威与独特性。目前，部分学术期刊已尝试引入AI工具，以辅助开展初稿筛选、格式规范、语法核对、图表审查及参考文献校验等工作，这实际上将部分内容把关的职责交给了算法系统。“现有AI检测系统本质上是‘用AI对抗AI’，以己之矛攻己之盾，其训练数据、算法逻辑均存在天然盲区。既然如此，高校就需要正视技术工具的阶段性局限，不能过度依赖AI检测。简而言之，检测结果只能作为参考，应建立‘技术检测—人工复核—学术申诉’的多元机制，避免‘AI说了算’的武断。”更严峻的挑战在于，大语言模型已能生成高度逼真、结构严谨的评审意见。若审稿人利用AI替代人工评议，将动摇学术评议的根本，即同行评议机制所依赖的专家专业判断、批判性洞察与学术共识。当这一核心环节可被机器模拟，学术共同体长期以来建立的基于“人”的信任、责任与价值判断体系，便面临被消解的深层危机。第三，在学术传播下游AI技术正绕开传统学术期刊的把关—发表—传播的认证体系。研究者利用AI生成文稿，直接投向预印本平台或数字优先出版平台，再通过学术社交网络迅速扩散。这些未经同行评议与学术期刊“把关”的成果，同样能引发广泛关注，致使学术期刊作为核心“质量守门人”的制度功能与权威性持续弱化。

（三）AI正在侵蚀学术共同体的"信任社群"生态

英国哲学家迈克尔·波兰尼在1942年发表的《科学的自治》一文中首次提出“科学共同体”概念，美国科学史家托马斯·库恩在1962年出版的《科学革命的结构》一书中就指出“常规科学和科学革命都是基于共同体的活动。”学术共同体通常是指由具有共同研究兴趣、专业背景和学术追求的学者组成的群体，强调学者之间的信任、尊重与合作。然而生成式AI的兴起，正从“谁在思考”到“谁在生成”迁移，AIGC具有了三重内涵：即数字孪生、智能编辑和AI创作。在AIGC所蕴藏的强大的内容生产能力的背后，却是生成式AI对学术共同体主体责任、学术规范和学术生态系统性地侵蚀。首先，主体责任的虚化。学术共同体的基石在于研究者，为其成果承担明确的认知与道德责任。然而，生成式AI的“黑箱”特性与内容的不可预测性，导致了责任主体的模糊与虚化。生成式AI侵权的类型比较复杂，具体包括：“第一，服务提供者可能未经同意，大量收集了涉及他人隐私、个人信息以及商业秘密等数据用于训练，此种信息处理行为可能构成侵权。第二，用户使用生成式人工智能的产品时，采取故意引诱等方式使生成式人工智能产生虚假信息，并且对虚假信息进行传播，这也可能构成侵权。第三，服务提供者开发的生成式人工智能生成各种虚假信息，或者生成具有侵权性质的文字、图片、视频等。因此，在生成式人工智能侵权中，责任主体具有复杂性和多元性。”当一篇论文的核心观点或文献综述由AI生成时，作者本人可能并未真正理解或认同这些内容。这就造成了“作者”与“思想”的分离。一旦观点出现谬误或引发争议，责任归属将变得极其困难——是用户、开发者抑或是期刊？这种责任链条的断裂，使得问责失去了明确对象。当学术共同体同行质疑某篇论文的史实准确性时，作者可以“AI辅助生成”为由推卸核心责任，信任的基础由此崩塌。其次，学术规范的僭越。生成式AI产出的“创新”论点，实则是无数已有文本碎片的非线性组合，这使得“原创性”这一核心学术价值变得空洞。学者无法判断眼前的文本是深思熟虑的结晶，还是精巧的“概率魔术”。AI无法提供其“思想”的准确来源，其生成内容可能是对某个冷门文献的转述，或是多个观点的混杂，且常虚构不存在的文献。这不仅使得后续研究者无法进行有效的知识溯源与验证，更彻底破坏了引注作为学术诚信和知识积累路径的功能。再次，学术生态的异化。在量化考核压力下，学者可能利用AI快速生产论文，导致“逆向选择”：追求速度和数量会排挤真正有深度、创新的研究，加剧学术泡沫，使评价体系偏离学术本质。

（四）AI正在引发学术评价的指标异化

传统学术评价体系长期奉行量化主导逻辑，将论文产出数量、被引频次及期刊影响因子等计量数据，作为评估研究价值与影响力的核心依据。这些易于统计的指标，在实践中被广泛采纳为衡量学术影响力的关键等效指标。然而在生成式AI的赋能下，学术门槛被降低的同时，科研效率却大幅提升，出现了论文数量的通胀与质量的空心化。第一，评价指标的“数字通胀”。研究者可以利用AI快速生成论文初稿、文献综述甚至实验设计，极大地压缩了研究和写作周期。这就导致论文发表数量激增，但内容的创新和深度却大幅下降。指标（数量）与质量（创新）之间的关联被切断，学术产出沦为“为发表而发表”的空心产品。第二，引用指标的失真。生成式AI不仅能生成论文，还能通过“智能引用”策略性操纵引用数据。AI可以精准分析高被引论文的行文风格和关键词，帮助研究者“包装”论文以增加被引概率。更有甚者，研究者可指令 AI 在生成内容中高频引用特定文献，甚至构建“AI 互引网络”（多个研究者使用 AI 生成论文时相互引用），短期内推高引用次数。这使得引用率从一个反映学术影响力的客观指标，异化为一种可被技术手段操控的数字符号。第三，评价标准的“价值错位”。在传统评价体系中，学术期刊的等级、影响因子等“形式指标”权重过高，而学术研究的原创性、创新性、实际价值等“实质指标”被弱化，AI 恰好能精准迎合这种偏好。在生成式AI的辅助下，研究的重心可能滑向如何更好地“提示”AI，以生成符合期刊审稿人偏好的文本范式。研究的价值不再是思想的原创性，而是对AI模型输出结果的“优化”与“微调”。从“知识创新”到“模式优化”，价值错位必然导致学术研究本真的迷失。因此，在AI时代，“我们应秉持积极的‘悲观’和谨慎的‘乐观’态度，对可能出现的技术异化现象保持高度警觉，在此前提下持续关注人工智能技术进步与学术评价体系的耦合关系，探索人机交互、共情、协同的新评价模式，注重学术‘全评价’。”

五、结语

生成式AI的迅猛发展，不仅代表着技术能力的重大突破，更标志着学术研究范式正在经历一场深刻的变革。当我们站在这个历史节点上回望，从尼葛洛庞帝预言的数字化生存，到今天AI深度介入学术生产的各个环节，技术与人文社会科学的融合已经从一个边缘话题转变为学术生态的核心议题。生成式AI以其独特的技术哲学——强调“成为”而非“存在”，突破了传统人工智能的功能边界。通过深度学习、模型构建与训练优化的技术闭环，它实现了从“感知理解”到“创造生成”的能力跃迁。在人文社会科学研究中，它推动文献挖掘、情感计算与网络分析等方法创新，促进定性定量融合，并作为技术中介催化跨学科整合，预示科学研究向“人机有机融合”演进。然而，其能力根植于统计拟合与模式模仿，缺乏真正因果理解与原创思维，本质上仍是“精致的哲学僵尸”。这一根本约束提醒我们，不可将工具理性凌驾于人文精神。更严峻的是，生成式AI正冲击学术生态根基，其“黑箱”生成消解原创性，以概率重组替代思想创新；内容效率优势削弱期刊把关功能，扰乱同行评审；责任虚化侵蚀学术信任，量化操纵助长评价异化。这迫使我们反思，当学术生产、评价与交流的全流程均可由算法介入甚至主导时，学术共同体的独特价值何在？

面对困境，须超越乐观与保守立场，寻求辩证统一。首先，明确AI是“认知协作者”而非“认知主体”，其在数据处理、文献梳理等方面作用显著，但问题提出、理论构建与价值判断仍依赖人类学者。其次，须构建AI时代学术伦理框架，确立AIGC标识规范、责任归属与防舞弊机制。最关键在于，我们要重申学术研究坚持的本体价值：对真理的探求、思想的深度与人文的关怀。AI无法替代学者的学术直觉、灵感顿悟与价值立场，这些才是创新之源。未来人机协同将走向深度能力互补，人类提供问题意识与价值导向，AI承担数据与知识重组。最终，生成式AI对学术的真正影响不取决于技术高度，而取决于学术共同体使用的理性高度。唯有自觉、调适与规范，方能使技术革命成为学术进步的助力，在人机共生之间走出理性和谐之路。这既需对技术保持开放探索，也需对学术传统心存敬畏，是为AI时代守护价值、开创未来的智慧所在。

张耀铭，《新华文摘》原总编辑，二级编审。

来源：《学术探索》2026年第5期

张耀铭：AI与学术研究：协同与边界

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏