在人工智能时代,我们呼吁更加重视研究者的个性化思考和独特经历,以促进优秀成果的产生。在遵守历史学科基本原则的前提下,史学家应精雕细琢历史细节,也要勇于探索,创作人工智能难以企及的杰出作品。
相较于2022年底,历史学界不少人对人工智能的态度已从最初的断然拒绝逐渐转变为有所保留地接纳。史学界并非世外桃源,无法也不应将人工智能拒之门外。历史学家开始尝试发挥数字技术的巨大潜能,让人工智能参与研究实践的各个环节,将学者从材料整理、文字润色、文献翻译等劳动中解放出来,把节省的脑力分配给更具创意的工作。然而,当众人热衷于探讨人机协作时,也应看到这一趋势背后潜藏的隐忧。AI辅助历史书写,本质上类似竞技体育中的兴奋剂,可能催生思维惰性,也可能破坏学术公平。我们迫切需要对此问题进行反思,为历史研究构建人机共生的健康模式。
沦为认知兴奋剂
随着数字技术进步,史学研究方式发生天翻地覆的变化。在兰克时代,史学家选定一个选题后,会先借助图书馆的卡片目录梳理二手文献,再前往档案馆查找一手文献。21世纪初,学者依靠知网或者JSTOR等线上学术成果发布平台检索已有研究成果,通过在线数据库获取档案材料。史学研究的数字化路径成为学术界共识,甚至成为教科书内容。2025年初发布的DeepSeek-R1,进一步降低公众使用人工智能技术的门槛。学者的研究路径可能继续拓宽,人工智能介入历史研究,将成为一种常态。人机协作的工作场景可能如下:用户向大模型提问,通过人工智能工具了解某个研究领域的参考文献、获取研究思路,只需轻点鼠标,借助超链接便能获取相关数据,然后与大模型简单对话,即可获得研究提纲。研究者还能巧妙运用检索增强生成技术,把自己珍藏的史料改造成专属知识库,用语义检索工具快速定位查询。学术研究从未像如今这般便捷,生成式人工智能带来学者的能力提升。据此,有学者推测,“通过机器初筛搭建基线,学者精校融入人文判断,最终由社群共识完成价值校准”,实现知识生产的范式跃迁,人工智能与史学界共生发展,成为映照文明的新棱镜。
图为人工智能平台Transkribus,由欧洲合作社组织READ-COOP开发运营,主要提供西方历史文献的自动识别、转写、标注与检索等服务,在数字人文领域受到广泛关注和应用 资料图片
笔者认为此类设想或许过于乐观。现代社会的很多技术进步都号称提升了人的能力——交通工具是脚力的提升,望远镜是眼力的提升,电话是听力的提升,但是在各种便利工具协助下,现代人反而越来越懒惰。历史研究绝非易事,正如历史学家林·亨特所言,写作并非简单地将作者头脑中已有的意识或思想转录下来,而是充满痛苦的历程。在新的学术伦理尚未确立之前,人机协作的工作模式有可能蜕变为“认知兴奋剂”。任由人工智能无限制参与史学研究,恐将导致史学家陷入“上瘾”状态,给思维能力带来副作用。在体育界,人们都知道兴奋剂对身体的伤害,出于对运动员健康状况和公平竞争的考量,全面禁止使用兴奋剂已经成为共识。相比之下,人工智能对历史学家“健康”带来的副作用,可能不如兴奋剂那般直接与显著,让学界对其危害性掉以轻心。长远看,不加限制地使用人工智能工具,犹如吞食“认知兴奋剂”,让使用者逐渐形成思维惰性。
思维惰性一旦形成,负面影响显而易见。在2025年美国历史学会第138届年会上,王希教授论及对美国史学界的一项观察:人工智能进入历史学的写作与教学领域,学生“假装学习”、老师“假装教学”的苗头着实令人忧虑。随着人工智能日益深入学术活动,学者“假装研究”的风气亦可能逐渐盛行。人工智能工具都声称能够提高文献的利用效率,从而让用户获得在短时间内熟读百万字档案的能力。这其实是一种错觉,用户仅仅是被数字技术裹挟着囫囵吞枣,用算法代替了思考。
加剧数字鸿沟
自2022年底GPT-3.5发布以来,世界迅速迈入大语言模型时代。一般而言,模型参数规模越大,功能越强大,但近年来由于算法优化,参数规模较小的模型在性能上也能媲美甚至超越大模型。例如谷歌的Gemma 2,仅凭2亿参数,便在性能上超越GPT-3.5。使用大模型的成本,因市场竞争激烈而大幅降低,“大模型自由”已不再是奢望。随着智能体(Agent)技术进步,涌现出众多易用的工作流平台,如Dify、n8n等。普通用户可通过个人电脑或手机轻松部署人工智能,史学家运用生成式人工智能的门槛进一步降低。因此,有人认为人工智能将提升历史研究的公平性,因其向所有人开放,人人机会平等,故而没有学者能通过“认知兴奋剂”抢跑。笔者认为,这种观点过于理想化,忽略了三个关键事实。
一是忽略“全球南方”的客观存在,也忽视数字鸿沟的严峻现实。自数字革命发端以来,数字鸿沟现象一直是备受关注且被反复探讨的议题。人工智能的发展依赖于算力、算法和数据,均需长期投入与积累,并且面临高投资、高风险的压力。2024年末,斯坦福大学发布《全球人工智能实力排行榜》,从AI技术的专利水平、发布大模型的数量、研发投入金额等维度,对各国人工智能实力进行评估。在全球36个较为重要的AI参与国家中,中国和美国占据绝对优势地位,美国处于断崖式领先地位,很多国家甚至不具备上榜资格,充分体现不同国家人工智能发展水平的巨大差距。对于大多数国家而言,算力、算法和数据中的任何一项,皆是难以突破的障碍。
二是忽视不同模型和工具在功能与效果上的差异。很多大语言模型已实现开源,机器学习算法也十分成熟,但诸如参数微调之类的“独门绝技”通常是机密。参数规模是影响大模型能力的关键指标,参数规模与硬件水平相关联,需要商业公司具备雄厚的资金作为支撑。更重要的是,训练大模型需要优质数据资源,数据质量的优劣,直接导致不同模型能力的差异。例如,多模态人工智能在历史研究领域具有重要价值,能够满足学者重建历史场景的需求,甚至可模拟长达亿万年的生命演化过程。然而,不同人工智能产品多模态功能的实现效果,存在显著差异。青岛大学德国史专家朱轶杰依托私人收藏的历史照片,运用人工智能技术将照片制作为动态视频,使观众得以体验生动的历史场景。通过对比可以清晰看出,不同大模型在生成历史场景的真实度、流畅度等方面存在不同表现。尽管人工智能产品具有公开性,且存在大量开源的大语言模型项目,但事实上无法做到完全公平。不同模型在初始阶段即存在显著差异,人机协作的实际效果更是天差地别。学者将大模型作为辅助工具,尽管表面上面临相同机会,但如果某一辅助工具能够提供近乎无限的资源,而另一工具的资源十分有限,能否被视为公平竞争?
三是忽略少数学者的选择自由。尽管人机协作在学术效能方面具有显著优势,但仍有学者更信赖自身的学术直觉与判断,对算法水准持怀疑态度,放弃使用人工智能。这种基于学者自由意志的“人工智能极简主义”,将造成不同学者之间的数字鸿沟。虽然这是少数学者自主选择的结果,但仍需关注。当人机协作的历史书写普及之后,学术成果的人工智能“含量”越来越高,完全由人类史学家独立完成的研究反而会成为稀缺物。充分利用数字工具进行历史书写的学者,在效率方面很可能优于未使用者,学术界的优绩主义将逆向淘汰“低效”学者,显然不符合公平公正原则。
推动人机协作的良性互动
体育界有一个经典的“戈德曼难题”。运动医学专家戈德曼向众多运动员提出一个两难问题:是否愿意服用一种药物,该药物能确保其在比赛中获得压倒性胜利,但5年后将导致死亡。据戈德曼调查,选择服用违禁兴奋剂的专业运动员比例接近半数。这一比例一度使人们对体育精神丧失信心。然而,近期调查表明,选择服用兴奋剂的运动员实际比例没有那么高。这源于相关体育组织强化处罚措施,更重要的原因是运动员对兴奋剂副作用的认知日益深化,体育精神也获得公众更多认同。这一发展轨迹颇具参考价值,可用于考察人工智能对史学研究的影响。随着对人工智能“思维副作用”的认知逐渐深化,学者亦将主动约束人工智能的使用频率和场景。
在人机协作模式日益普及的背景下,我们可以从以下三个层面着手,推动人工智能与史学研究的良性互动。
一是明确权责,突出研究者的主体性。所谓主体性,一方面要求学者在人机协作中占据主导地位,另一方面要文责自负。从伦理学角度审视,人机协作从来不是完美的良策;哲学家试图通过价值对齐来提升人机协作的安全性和伦理性,但正如有学者指出,通过将人类价值嵌入人工智能的方式实现价值对齐,存在责任不对称风险,效果不佳。美国历史学者古尔迪(Jo Guldi)在《文本挖掘的危险艺术》中,全面梳理文本挖掘技术在历史研究实践中的作用,从正反两方面介绍数字人文技术的价值和困境,将学者的主体性放置在很高的位置,认为如果没有历史学者的介入,文本挖掘将是“危险的”。在无法完全避免大模型幻觉的情况下,在多大程度上使用生成式人工智能的内容,在出现问题纠纷时又由谁来负责,都需要明确的权责划分。
二是构建新的研究伦理。马克斯·韦伯通过研究发现,新教徒群体之所以更具“资本主义精神气质”,是由于他们深受预定论的困扰,生出无处安放的救赎焦虑;为缓解这种焦虑,他们遵从路德提出的“天职观”,在日常生活中实现“入世的苦行”,最终选择用信仰的力量获得慰藉,在不经意间推动了经济发展。韦伯命题带来的启示是,学术活动同样需要信仰力量的支撑,才能让研究变得纯粹。许多学者持有类似立场,尽管历史书写并不是一件轻松惬意的事情,他们并不会因为生成式人工智能而放弃写作,因为写作无关发表,无关稿费,而是思想外化的过程,遵循内心的表达欲。当史学家都是基于自发的研究热情开展研究,就能在人工智能时代构建起新的工作伦理。
三是尊重学者个性。大语言模型的出现显著提升历史书写的基准水平,但历史学家不应满足最低标准,应致力于创造更具价值的成果。随着智能体技术普及,历史研究过程被程式化,知识生产在一定程度上成为流水线作业。如果研究者只能在数字工具的框架内安排研究流程,缺乏自由发挥的空间,就会抑制研究生态的多样性。因此,在人工智能时代,我们呼吁更加重视研究者的个性化思考和独特经历,以促进优秀成果的产生。在遵守历史学科基本原则的前提下,史学家应精雕细琢历史细节,也要勇于探索,创作人工智能难以企及的杰出作品。
生成式人工智能作为新兴技术,其发展路径如何演变,科学界仍在持续探讨,产业界已出现“人工智能泡沫”即将破裂的论调。鉴于此,史学界需保持高度的战略定力以应对人工智能带来的挑战,基于更多元的研究实践构建合理的人机共生模式。在人机协作的磨合过程中,学者须发挥主导作用,始终保持对其潜在负面效应的警觉。
作者单位:南京大学历史学院