周宪：AI形象的哲学挑战

引言

历史上，人类从未像今天一样面临着一场深刻的科技革命。人工智能（以下简称AI）彻底地、全方位地和持续地改变着人类的生存形态，从人类世到后人类，一系列颠覆性的变革接踵而至，一个人类文明的“奇点”正在到来。

在AI横扫一切领域的当下，艺术也面临着深刻的危机。向一个著名的生成式语言大模型提问：“如果毕加索使用AI创作会怎样？”它自信满满地回答道：“毕加索本身就是不断打破形式、探索风格的艺术家。如果他可以使用AI生成图像、模拟笔触或混合不同的艺术风格，可能会加快他的实验节奏。他可能会用AI训练自己早期的风格来生成新图像，然后对其进行人为再创作；利用AI模拟非西方艺术风格（如非洲面具、东亚水墨），以探索文化融合；创造多重自我，让AI根据不同时间段的毕加索风格模拟创作，然后进行对比或融合。”让AI回答有关AI的问题，这样的答复并不出人意料，但现实却绝非如此简单。2022年美国科罗拉多州一个博览会上，一幅题为《太空剧院》（图1）的作品拔得头筹，引发了巨大争议，导致许多参赛者不满。人与机器竞争究竟意味着什么？传统的艺术观念和美学标准在此是否仍然有效？面对席卷而来的AI形象风潮，过往的形象哲学原理和观念还有解释效力吗？

图1艾伦《太空剧院》

一、形象发展史和形象类型学

形象与人类文明不可分离的关系非常久远，从阿尔塔米拉的洞穴壁画，到范宽的《溪山行旅图》，再到毕加索的《格尔尼卡》，形象不但记录了人类历史的演变，也标识出文明的不同历史阶段及其时代精神。鲍德里亚从形象与现实的关系出发，归纳出形象的四个不同阶段：第一个阶段形象是深刻现实的反映；第二个阶段形象掩盖并改变了深刻的现实；第三个阶段形象掩盖了深刻现实的缺失或不在场；最后一个阶段形象与现实毫无干系，它不过是自己的纯粹模拟。这里，笔者想提出另一种历史分类法，即从视觉性角度来区分形象的历史演进。第一个阶段是原始形象，它依赖的是原始先民的刺激—反应范式的生理视觉性；第二个阶段是古典形象，始于“轴心时代”（前800—前200），它基于古典型视觉，蕴含了丰富的文化意味，人类几大文明在此期间都创造出自己璀璨的视觉形象，以建筑、绘画、雕塑等最为突出，这种形象及其视觉性延续到早期现代；第三个阶段是早期现代，以文艺复兴为标志，科学昌明导致了透视法、暗箱、望远镜的出现，光学和视觉的科学研究极大地促进视觉性及其形象认知，模仿和再现的美学思想在此阶段达到了令人惊叹的高度；第四个阶段是机械复制时代，尤其是摄影的出现，导致了视觉性及其形象生产的颠覆性变革，一如本雅明所言，机械复制时代的艺术促使传统大崩溃，摄影、电影、电视、广告等全新的形象生产，极大地改变了手工制作形象的传统格局；第五个阶段是20世纪90年代开始的数字化影像，鲍德里亚所预言的虚拟形象及其超现实已然成为普遍发展趋势，媒介数字化、计算机算法和全球互联网三位一体重塑了当代社会和文化；第六个阶段，也就是最新的一个阶段，则是21世纪以来的AI时代，它延续并拓展了前一阶段的数字化虚拟视觉性和影像，创造出人—机共生的视觉性和跨物种视觉性，形象生产不但空前丰富甚至冗余，而且变得愈加多样化、多媒介化和多模态化。

从形象本体论的角度，将形象与现实关系的四阶段说，和从视觉性来考量的六阶段说加以融合，可观察到形象历史发展进程中三个标志性的节点：第一个是手作形象，这在机械复制时代以前是人类文明的基本形态，通过肉眼和手艺来描绘形象，绘画是其最典型的艺术样式；第二个则是机械复制时代的摄影图像或影像，通过复杂的摄影装置（如照相机）和胶片化学反应（如银版）形成照片或负片；第三个是数字化影像，它实际上是一组可供计算机存储和处理的数字，这些数字描述了影像中每个像素的亮度或颜色信息。让我们来逐一分析这些形象生产的标志性变革及其影响。

二、摄影影像的变革

从手作形象到机械复制影像，这无疑是一个深刻的变革，这场变革带来一系列巨大的观念转变和形象的解放。摄影照片极大地撼动了传统绘画的统治地位，模仿或再现现实的技法、能力或观念被祛魅了，以风格和技术见长的绘画艺术，在瞬间生成的照片面前显得很不合时宜。有趣的是，照片并没有取代绘画，艺术家们开始利用照片作画（如高更等）。面对新变局，一些艺术家感到沮丧，理论家们则作出了不同的阐释。本雅明认为摄影及电影的出现导致了四个方面的转变：

第一，摄影导致了绘画的原作性和权威性消散，因为照片可以无差别地加以复制。如果说绘画是独一无二的，那么照片则可无限复制。

第二，绘画及其古典艺术具有膜拜价值，而机械复制则将艺术品的价值从膜拜转向展示。这个变化很容易理解，比如《蒙娜丽莎》具有唯一性和无可取代性，因而备受尊崇。照片则更容易打破时空限制而广泛传播，可以更具展示性。

第三，传统绘画由手工绘制并且绘制技法复杂，因而具有独一无二的原作性和权威性，总有某种独特 “灵韵”，需要一种沉思式的审美静观，但照片全无此种“灵韵”，典型的观看效果是短暂的震惊。

第四，传统绘画由于上述诸多特质而具有某种永恒价值，且不可修改或复制；但电影等机械复制艺术则是可修改的。

不同于本雅明，巴赞则从形象本体论角度强调摄影影像与绘画图像的根本区别。他认为历史上绘画一直在表达精神与逼真再现现实两种追求间徘徊，无论画家如何努力，绘画与被画者都不会有同一性，透视法仅能呈现特定瞬间的场景所具有的戏剧性，却不能表现出事物的运动。因此，19世纪中叶以来，绘画遭遇了空前的危机，模仿或再现的美学原则不再有效。巴赞的核心观点是，艺术趋向于主观性，而摄影则将形象建构从幻象的困局中解放出来，以将人排除在外的客观性来创造形象，最终彻底解决了写实难题。绘画与其周围的世界是异质的，而摄影与其周围的世界则是同一的，前者是替代，后者是补充。

摄影与绘画不同，它的独特性在于其本质上的客观性。况且，作为摄影机眼睛的镜头代替了人的眼睛，而它们的名称就叫objectif。在原物体与它的再现物之间有另一个实物发生作用，这真是破天荒。外部世界的影像第一次按照严格的决定论自动生成，不用人加以干预，参与创造。摄影师的个性只是在选择摄影对象、确定拍摄角度并在对对象的解释中表现出来，这种个性无论在最终的作品中表露得多么明显，都无法与画家表现在绘画中的个性相提并论。

巴赞虔信，摄影影像的“自动生成”方式赋予影像以客观性，这是任何绘画都无法获得的力量。“我们不得不相信被摹写的原物是确实存在的。它是确确实实被重现出来，即被再现于时空之中。”据此他断言，绘画是一种复制现实的较低级的技巧，只有摄影机镜头下的客体影像才能满足人对再现原物的需求。更进一步，电影影像还突破了绘画静止画面的局限，开启了运动影像的新时代，“事物的影像第一次映现了事物的时间延续”。他极为乐观地说：“摄影机镜头摆脱了我们对客体的习惯看法和偏见，清除了我们的感觉蒙在客体上的精神锈斑。”值得注意的是，巴赞多次使用了“第一次”来描述摄影及其影像，借以揭示摄影及其影像有别于绘画图像的革命性转变。巴赞的这篇经典论文发表于1945年，比本雅明的文章晚了10年，两者可以说是讨论同一问题的“姊妹篇”，共同宣告了人类形象生产的一个新时代的到来。但囿于当时摄影技术和艺术的实际水平，巴赞尚未预见到摄影后来的巨大跃迁及革命性发展，更无法预料到数字化影像的出现颠覆了当时对摄影的认知和判断。

三、数字影像的变革

从某种意义上说，人类文明史就是科技不断变革的历史。从形象史角度看，形象的变革一直在或隐或显地发生，并直接呈现为形象技术和视觉方式演变。从原始壁画到古典绘画，从古典绘画到摄影影像，再从摄影影像到数字影像，每一次重大的变革都始于技术，进而影响到人的感知方式和视觉观念。

毫无疑问，数字影像是人类形象史上的一次重大变革。试想一下，从古典画家精细模仿呈现的画技，到照相机的光学成像，再到当下智能手机和无人机的数字成像，尤其是AI形象，其间发生的转变是惊人的，数字影像极大地改变了我们的视觉生态和文化形态。如前所述，数字影像在技术上进一步简化并同时复杂化了摄影技术，影像被分解为一组可供计算机存储和处理的数字，这些数字描述了影像像素、亮度或颜色。这里所谓“数字”（digital）是“涉及数字或计算机技术，尤其是互联网”，诸如数字艺术、数字经济或数字货币等；同时，它还有另一层含义——“指现实世界中存在之对象虚拟的、计算机介导的对应物”——涵盖了数字底片、数字购物车和数字墨水等实体。

如果说本雅明和巴赞的经典理论是基于摄影和电影影像的话，那么，数字影像则开创了又一个全新的形象范式。从摄影到数字影像的过程，究竟发生了什么值得思索的转变呢？从时间上看，数字化的影像技术的广泛使用是在20世纪80年代末，其间摄影已经逐渐摆脱胶片和化学洗印的方式，转向了程序化数字处理的新范式。在这个过渡阶段，鲍德里亚提出的一系列形象与现实关系及仿拟和仿象的理论，相当程度上预见了数字影像时代的到来。另一个值得重视的思想史资源是弗卢塞尔的“技术图像”理论，它深刻触及数字图像的本体论。他断言技术图像乃是程序的产物，这种影像看起来像是来自现实世界，本质上却是由算法决定的。技术图像是信息从一端输入程序，然后从另一端输出，处理这些信息的是一个未知的“黑匣子”，不搞清其中发生了什么就无法理解技术图像。从本体论上看，技术图像的客观性只是一个幻觉，它不再是从现实世界映射到人视觉中的东西，而是由技术程序向人投射或塑造的“世界”。“技术图像的神奇魔力无所不在：它是给生活施以魔法的某种方式，正是在这种魔法中，我们在这些图像的作用下去体验、认知、评价并行动。”这段话不啻是对后来数字影像崛起并支配当代社会文化的一个有远见的预判。

随着数字影像的普及和蓬勃发展，一种新的形象形态引发了多学科的深入探究。有学者将电影作为数字影像的“前史”，认为其属于“旧媒体”，而数字影像则是革命性的“新媒体”。马诺维奇认为，数字图像本体既不是画像或再现对象，而是代码、数据、可编程的对象，因此决定数字影像的是编程逻辑及其所建构的感知逻辑。数字影像以其可变性、可计算性、非线性和程序驱动性而有别于传统绘画和摄影图像。其可编程、可计算和可变化的显著特性，使之有别于历史上任何形象类别。马诺维奇将人的手工与各种工具关系的历史演变分为五个不同的历史阶段：第一个是手工制作图像阶段，传统的画家在画室训练即如是；第二个是手工创作+辅助装置（如透视仪和光学描图器）阶段，手工与装置协作，部分职能委派给机械或光学设备；第三个是使用摄影设备、X射线、遥感器、摄影测量仪等，从手工制作转向用机器记录信息的阶段，机器助手派上用场；第四个是三维计算机图形（3D CG）阶段，在计算机中定义三维模型，并使用算法模拟光源、阴影、雾气、透明度、半透明性、自然纹理、景深、运动模糊等效果，从记录转向模拟；最新一个阶段则是生成式AI阶段，它使用媒介数据集来预测静态图像和动态图像，从模拟转向预测。他认为AI生成式媒介或形象的出现，乃是人类历史上一种颠覆性的形象生产新范式，“计算机可使用包含各种媒介中现有形象的大型数据集来‘预测’新形象（包括静态图像和动态影像）”。

马诺维奇的手作与工具关系的五阶段历程，显然有一个手工性减弱而工具性上升的发展趋势，手作的许多功能逐渐被工具或机器所取代。当越来越多的人将对形象的操控功能委派给机器时，当机器越来越多地帮助人类甚至自主生成形象时，我们不得不承认，人类文明史上首次出现了形象生产的机器代理。一个全新的形象文化和视觉经济的时代已经来临。

四、AI形象的再变革

2019年3月，德国艺术家克林格曼运用AI创造的独特艺术品《路人的记忆I》（Memories of Passersby I，图2）在苏富比拍卖。该作品由两个4K屏幕和一个控制台构成，克林格曼使用了数千幅17至19世纪的肖像画来训练其AI模型，以一个类似 Tinder 的应用程序来加速学习过程，让机器学会并形成审美偏好。此作无疑是AI的先锋之作，它完全自主，运用艺术家开发和训练的GAN（生成对抗网络）系统，源源不断地生成肖像，呈现出各式各样的男女面庞。

图2 克林格曼《路人的记忆I》

2024年，中国人工智能学会发布了《中国人工智能系列白皮书——AI驱动下的艺术教育革新》，提出一系列推动本土AI时代艺术创造和教育的宏大设想。但白皮书对AI艺术及其教育的一些关键问题未予分析和反思，而这些关键问题是今天难以回避的。结合本文开头提及的获奖作品《太空剧院》（图1），AI形象建构的革命性转变，已经强有力地挑战并动摇了传统哲学和美学的许多核心观念，向人们提出了一系列亟待思考和回应的理论问题。

从手作绘画图像，到摄影光学—化学影像，再到数字影像，一直到最新出现的AI形象，其间每次变革，新技术总是先给人们带来巨大冲击，尔后人们逐渐对其适应并习以为常。但相较于历史上的形象生产和传播的变革，AI时代的形象范式无论在范围上还是深度上，其革命性都远甚于历史上的任何一次变革。正因如此，这一变革所带来的问题和挑战必须认真应对。虽然AI形象建立在数字影像基础之上，但二者还是存有许多值得深究的差异。只有理解了这些差异，才能搞清楚AI新的形象范式给既有文化带来的颠覆性冲击。

首先，从形象生产的内在机制来看，数字影像的创作依赖于人，无论使用PS还是3D建模或数码摄影设备，各种装置或器具均听从人的指令和安排。因此，人对工具起到显而易见的操控作用，且数字影像的基本素材多半来自现实世界，只是被数字化了。与此截然不同的是，AI形象是通过生成对抗网络（GAN）、扩散模型（DM）或深度学习模型（Transformer）等系统，基于大规模图像数据集自主地生成形象，算法在这个过程中占据主导地位，因而最终生成何种形象是无法控制和推定的。克林格曼的《路人的记忆I》就是一个典型例子，屏幕所呈现的肖像不断生成演变，具有发展变化的无穷可能性。正是这种超越了人意图控制的形象生成，给AI形象创造带来巨大的不确定性和可能性，机器作为人类代理充分彰显出超越人之处，充满了不可预料的惊奇、意外和新颖性。也正是在这里，关于AI形象是否具有与人类一样的创造性和想象力成为一个难题。

从美学的角度看，任何创造性的首要条件都是新颖，即不同于已有的文化艺术现象，在某一方面产生了全新的创意。这一点从艺术史来看最清楚，无论是从风格史角度说，还是从社会史视角看，后来的艺术流派或作品之所以能够超越已有风格和美学，就是因为创造了全新的艺术表现范式或风格。然而，问题的复杂性在于，新的并非总是好的或有价值的，创造性的另一个条件是“有价值的新颖”。如果我们把“新颖”+“有价值”的二元标准用到AI形象上，就会碰到相当大的麻烦。因为有价值或价值高低没有一个客观标准，而是与复杂的主客关系和文化判断有关。《太空剧院》获奖之所以引起极大争议，一个重要原因就是，在这幅画是否比艺术家手绘的作品更有价值方面有不同认知。当大多数参赛者得知AI作品获奖而自己的手绘画作出局时，深感仿佛是将两套不同的评价标准用于同一竞赛，就像是人和机器人同台竞赛。尤其是《太空剧院》的操演者（是否能称之为作者尚存疑）艾伦，并未事先向赛会和评委说明其作品是借助AI完成的。这里就出现了一个AI形象价值与人类艺术价值对齐的问题。因为机器总是在现有的数据集中学习，算法往往趋向于统计学的趋中状态，如何对齐人类艺术创新的美学标准便是AI艺术评价的关键所在。虽然人可以通过提示语和参数调整来影响和校正机器生成，但最终结果往往是不可控和不可预见的，尽管晚近有学者认为AI形象生成具有“可预见性”（如马诺维奇）。从形象生成的结果来看，不可控和不可预见的结果，既有可能是有价值的创新，亦有可能是完全无价值的输出。很多艺术家就是通过不断地试错来获得想要的结果，比如《太空剧院》先是使用Midjourney图像生成工具，以文生图多次语言提示生成最初画面，经反复微调，确定了3幅图，经过900多次迭代，并用其他工具来清理画面和渲染风格，后使用Gigapixel AI 的软件运行图像来提高画面分辨率，最后求助一家印刷厂机器打印完成。从AI形象本体论上说，其算法集成无可挽回地摧毁了艺术品的关键特质——本真性。如果说传统艺术品有单一性主体和语境来源的话，那么AI形象则是在无单一来源和无语境限制的条件下生成的。

其次，AI形象挑战哲学和美学的另一个复杂问题，就是AI形象对传统形象本真性和“灵韵”的彻底消解。本雅明在讨论传统艺术形象时特别提到“灵韵”（aura，又译作“韵味”“光晕”等）概念。按照他的描述，灵韵乃是艺术品之所以为艺术品的本真性特质，是自然对象所不具备的。“灵韵”是从时空角度体验到的“在一定距离之外但感觉上如此贴近之物的独一无二的显现”，亦即一件艺术品“独一无二”的本真性或原真性，“一件东西的原真性包括它自问世那一刻起可继承的所有东西，包括它实际存在时间的长短，以及它曾经存在过的历史证据”。本雅明认为机械复制使艺术品的灵韵消散了，因为工业社会的大批量复制技术颠覆了一件艺术品或工艺品在被制作时流传至彼时的特定内涵。

这里特别需要指出的一个关键问题是，AI形象的生成是基于算法和海量数据集，因此它是计算模型运算的产物，是海量形象数据集的重组和新架构。比如，克林格曼的《路人的记忆I》，虽然是基于伦勃朗、鲁本斯等许多“老大师”的带有原真性的肖像作品，但一经算法处理，这些原作的独一无二特质便消失殆尽，生成的形象最终是数据在算法运作下构成的趋于中位数的形象。我们不再能从中找到伦勃朗、鲁本斯或其他老大师的任何原真性或灵韵。传统美学有一个重要原理，即所谓“风格即其人”（布封）。AI形象虽仍存有一定的风格特点，但与“其人”（特定艺术家）毫无干系。这里，我们瞥见了AI形象生成的一个独特的“打碎重来”的“过滤功能”，即对海量原始图像的自主重构，“清洗”了原图的独一无二性，“消解”了原图与原作者密不可分的具身化关系，也即在特定时间和空间或社会文化语境中创作原图的那些主客观互动关系。可以断言，“灵韵”在技术革命进程中存在着不断加剧的消散趋势。摄影和电影是一次本雅明观察到的消散，数字影像是又一次摧枯拉朽式的灵韵消散，而相较于历史上的灵韵消散，AI形象的涌现，显然是人类历史上最为激进和最具颠覆性的灵韵消散。单一源头被数据集所取代，“灵韵”被“漂浮的”能指所取代，独一性被可修改性和可重复性所取代，本真性被数据合成的混杂性所取代。自浪漫主义以来关于艺术的主体观念、情感性、想象力和天才表现等美学原则，在AI形象时代已荡然无存！以至于当下AI艺术争议最为激烈的问题便是：AI形象有作者吗？著作权属于谁？

再次，AI形象生成从传统形象生成的单一源头或本源（时空特定性、作者特殊性、创作心态具体性等），转向了海量数据的多样化源头，这些数据集经过学习模式和计算模式的过滤清洗，作为其来源的原图的信息和灵韵消散殆尽。这就带来另一个新的问题：AI形象的“语境崩塌”（context collapse）。“语境崩塌”的观念由来已久，最初出现在当代传媒研究中，以梅罗维茨20世纪80年代提出的“no sense of place（无地方感）”为代表。这个概念意指电子媒介的交往与流通打破了传统的空间地方区隔，从私人空间到公共空间，“特定地方性”的社会功能和意义消失了，人们的行为方式和思维方式不再依赖于特定的“地方性”。在全球互联网时代，无地方感现象更加普遍，数字化交往和虚拟现实的出现，导致了鲍德里亚所说的“超现实”，所以传播学者提出了“语境崩塌”的概念，意指因Twitter将受众扁平化及其身份虚拟化所导致的传播和接受的新困局——信息交流中的无语境判断。信息发送者不知道自己的信息达至谁，接受者也不知道信息发送者的真实情况，于是，用以判断信息的语境彻底崩塌。笔者将“语境崩塌”概念用于AI形象，则带有更为复杂的含义。经过算法处理的原始信息已经被重新清洗，原图的语境意涵不但被过滤了，而且与更多的相似或同类形象“搅拌式”混合，原图被扁平化处理为全新的形象组合。有的AI形象完全超越了原图而无法追踪源头及其语境，成为一个全新的形象架构。比如《太空剧院》，不但场景是前所未有的，而且人物形象也充满了新的形构。从何而来？有何地方性意涵？如何理解和阐释？这些统统成为棘手问题。传统美学和批评的溯源式方法完全失效了，“知人论世”的方法在此无法诉诸实践，作者意图在此也无从追溯，风格史的判断全然无效。毫无疑问，AI形象的“语境崩塌”带来了形象传播、接受和阐释的诸多新问题和新挑战，需要一种新的AI美学来重新建构其知识学基础和批评判断标准。

最后，随着AI形象的海量生成和广泛传播，尤其是所谓AI艺术的逐渐成熟，这些AI形象与现实间关系的研究变得极为紧迫。越来越多的人深信，当前人类社会进入了一个新的“无真相时代”。AI形象的发明，使篡改、修图或伪造成为形象本体论的致命“软肋”。如果说传统形象源自现实，那么，AI时代的生成式形象则反其道而行之，一如鲍德里亚所言，形象不过是自己的拟像或仿象，与任何现实都无关。鉴于这个问题的讨论较多，本文暂时搁置，将最后一个问题聚焦于语言与形象或文本与形象之关系的新思考。

20世纪末“图像转向”或“视觉转向”的一个内在冲动，是对“语言学转向”的反叛，也就是将语言学模式从造型艺术或视觉文化研究中驱逐出去，回到形象本体论和方法论，用形象研究的独特方法和思维方式来探究形象。无论是格林伯格的“更新的拉奥孔”理论，还是伊梅达尔的“图像操演论”，或是米歇尔和伯姆的“图像转向论”，都旨在强调视觉性和形象本体论的重要性——必须有适合视觉形象的独有方法才能把握到形象的真谛。但AI形象则出现了一个重要转向，那就是文本或语言形式的提示词成为形象生成的关键指令，“文生图”再一次凸显了形象服从于语言的新关系形态，而提示词如何设计便成为决定AI形象质量和特色的关键一环，以至于有专门的研究和手册来启发和引导人们如何设计提示词，如《AI形象提示词800例手册》。该书强调艺术、科技与视觉美学的融合，揭示AI如何通过复杂算法和数据解读来处理和模仿独特的风格，聚焦提示词创作能力，旨在帮助读者设计出更具影响力、更高效的提示词，以便其通过各种AI 图像生成器（Dalle-3、Midjourney、Stable Diffusion、Leonardo AI等），创造出可欣赏并令人叹为观止的形象。由此便引发了一系列重要的问题：文生图是否意味着语言对视觉形象新的宰制？图像转向或视觉转向所倡导的回归形象本体论的趋势是否就此终止？形象的视觉创新和迭代取决于形象自身还是取决于提示词语的设计？AI对语言意义的学习与形象生成之间是否存在同一性？

“艺格敷词”（ekphrasis）这个古老的希腊概念，就是指以文字来描述图像的修辞方式，古往今来，语言与图像的关系始终是一个热议的话题。但从古到今，无论哲学家还是艺术家都一致认为，文字对形象的描绘永远不可能达至形象表意的效果和深度。西谚有“一图值千言（A picture is worth a thousand words）”的说法，这里的“值”意在表明，形象的表意与语言的解说之间存在巨大差异，后者无法完全达至前者的境界。所以，当AI时代进入了一个以文字来规范或创意形象的新阶段时，需要思考一种新的可能性，即文字对图像的暴政，会不会导致图像自身创新生成的枯竭和衰落。就当前AI形象的发展来看，情况似乎并没有这么悲观。由于AI的机器学习和算法迭代，实际上在提示词的指引下，出现了形象迭代发展的新可能。加之神经科学对视觉图像与主体注意力及审美偏爱关系的经验研究，可以观察到的事实是，形象创新更加偏重视觉注意力的吸引，以及无所不用其极的审美效果升级。以极具代表性的AI视觉装置艺术《机器幻觉——自然之梦》为例，AI艺术家阿纳多尔将其工作室2018—2021年间收集的3亿张公开的自然照片用于GAN算法加以训练，由此生成一个色彩、形状和构图每一刻都在变化的视觉之梦场景，进而通过自然美学的视角虚拟另一种全新的可能的自然。

图3 阿纳多尔AI装置艺术《机器幻觉——自然之梦》

这就提出了一个更加值得思索的问题：AI形象具有了历史上从未有过的视觉冲击性和审美效果，这究竟是人类艺术形象发展进程中一个值得赞赏和肯定的新阶段，还是一个令人担忧的发展歧途？目前，对这个问题给出任何结论都为时过早，因为AI艺术还在飞速发展的迭代过程之中。

结语

在结论里要对研究对象有所判断，而目前对AI形象的任何判断都必须慎之又慎。前文提出的一系列从形象史和形象哲学来考量的观点，明眼人一看便知，所持立场是站在过往美学和哲学立场上来反思当下AI形象的变革。这就引出了另外两个难题：其一，AI不断迭代创新，其发展速度之快，颠覆性之强，使此前任何判断都经不起推敲。模仿马克思的话来说就是，一切判断等不到确立便过时了。所以，前文所做的任何判断都只是暂时性的。其二，判断的立场实际上有多种，一是从过去的历史传统看现在，二是从当下甚至未来看现在，不同的立场会得出截然不同的结论。对AI艺术和AI形象研究的文献稍加翻检便可以发现一个规律，即大凡从事人文学科研究的学者对AI带来的变革总是忧心忡忡，而科技背景的学者则相当乐观。这种二元对立的知识生产张力，促使我们思考更深一层的方法论问题：有没有介于两者之间的“第三条道路”？

笔者以为“第三条道路”是可能的。从哲学上讲，传统人文立场和现代科技立场之间的对峙，说到底就是康德哲学纯粹理性与判断力的紧张关系，就是哈贝马斯现代性张力论中所说的认知-工具理性和审美-表现理性之间的对立。尽管历史上无数先哲对此做了大量调和与融合，但每一次重要的技术革命总是颠覆已有的观念和知识，一次次地激化这一矛盾。正像韦伯在讨论价值理性和工具理性关系时指出的那样，从一方看另一方总是缺乏合理性与合法性。如果站在中间或许能既发现彼此的差异和对立，又可以找到融合与统一的可能性。这么来看，“第三条道路”也就是第三立场，是在认知-工具理性和审美-表现理性之间的立场。从绘画到摄影，从数字化影像到AI形象，不同形象类型的争议和分离最终都会在新理论中走向共存与互容。在结论中无法探究这个问题本身，只是提出一种可能性，而这一可能性变成现实，需要更加深入的思考和探究。

原载于《社会科学战线》2026年第2期

周宪：AI形象的哲学挑战

APP | 公众号 | 微博 | 手机版

相同作者阅读

相同主题阅读

热门专栏