Lecture Guide · Block 4 / 10

AI特论 第1回「逆行之美学」
久保田晃弘 · 前半

来源:Tama Design University 讲座 当前块:第 4 块 · 软件化与数据库艺术

前面已经把生成式AI放到"预测媒体"的框架里理解了。从这一块开始,久保田继续往历史深处逆行:他先讨论生成式AI和"数据集作为档案"的关系,然后追溯到1990年代的软件化与数据库艺术。他的核心论点是:生成式AI不是突然变异出现的,而是软件文化长期发展的延伸形态。

九、作为数据集档案与信息的压缩·扩张

久保田从图像媒体的预测阶段继续推进:如果生成媒体不限于照片,也向绘画等领域发展,会怎样?他提到一位叫 Emanuele Arielli 的学者,把这种现象称为 Artificial Platonism(人工柏拉图主义)

人工柏拉图主义与"下一个伦勃朗"

人工柏拉图主义的大意是:学习大量某位大师的作品,从中找出所谓"本质"(essence),然后基于这个本质生成新作。久保田举了一个著名项目作为例子:

视频画面:"下一个伦勃朗"(The Next Rembrandt)项目生成的画作

"下一个伦勃朗"项目学习了大量伦勃朗的画作,试图找出"伦勃朗的精髓",然后基于它生成一幅"新作"。当时这类说法被煞有介事地传播:只要数据够多,就能让大师"复活"并创作新作品。

久保田说,对此有各种看法。其中一种看法是:这其实是档案(archive)

两种档案观:传统档案 vs. 数据集档案

久保田区分了两种理解"档案"的方式:

传统档案

尽可能收集某位作家的全部作品。收集即结束,档案的价值在于保存和拥有原作。

数据集档案

把收集的作品经过机器学习,将其特征量数据化。这个数据集就是档案。它不仅能保存,还能生成——从这个档案中可以产出各种作品。

传统档案收集的东西,每一件都带有某种"光晕"(aura),有本真之物,所以值得收集。但数据集档案更看重的是概率多数性,而非光晕。这是一种价值判断的转变。

关键问题:把艺术品变成数据集,我们究竟在保存什么?是保存原作的光晕,还是保存可以无限再生的统计特征?这从 2020、2022、2023 年左右开始,至今仍是持续讨论的议题。
学习的本质:压缩与扩张

久保田进一步解释:所谓"学习",实际上是输入的图像被送入一次 Latent Space(潜在空间),在那里被压缩,然后再扩张出来。

他提醒听众回想 Transformer Explorer 里那个时窄时宽的部分——那其实就是信息压缩与扩张的可视化。这种信息的压缩与扩张,正是这项技术极其重要的核心。如何压缩、如何扩张,其算法和架构至关重要。

Latent Space:信息先被压扁,再被重新展开。

他认为可以归纳出这样一条重要的技术脉络:生成式AI的底层逻辑,是把大量信息压缩进一个潜在空间,然后再根据需求扩张成具体输出。理解这一点,是理解后面历史脉络的关键。

十、1990年代:软件化与数据库艺术

再往前追溯,久保田强调一个非常重要的事实:生成式AI能做的,只是计算机能做的。因此,生成式AI技术不是突然变异出现的,而是我们使用软件做各种事情这一文化脉络的延伸。他认为这大概始于 1990 年代。

1980年代:计算机进入美术教育

在此之前,久保田提到一个历史节点:1980 年代,多摩美术大学曾高调宣布自己是首个引入 CG、计算机的美术大学。这意味着什么?

在媒体史中,从物质性、记录媒体、照片时代,开始尝试用软件进行美术教育。比如 Photoshop 等图像处理软件出现,或者各种声音也能用 MIDI 数据来创作音乐。久保田说,这些问题其实正是如今生成式AI所承担的全部问题。我们无法逃避这个土壤。换言之,不可能脱离这个土壤来思考问题,我们只能在这些软件的能力范围内思考能做什么。

Lev Manovich 的《Software Takes Command》

久保田再次提到马诺维奇,他为此写了一本书叫 Software Takes Command。重要的是这个书名——它致敬了 Giedion 的名著 Mechanization Takes Command(《机械化支配一切》),那是 20 世纪非常重要的文化史著作。

20 世纪是机械化时代,机器进入生产现场时如何改变了人类文化?马诺维奇的问题则是:现在我用笔记本电脑、计算机、互联网、智能手机,文化会如何改变?应将此作为一环来思考。

1990年代:创作的语言变成了软件语言

实际上,90 年代发生的是创作的软件化。久保田举了一个很具体的例子:

以前画画时,人们用颜料、素材来讨论创作。但软件化之后,创作的语言变成了:"把饱和度提高 5% 会怎样?""给 3 像素高斯模糊会怎样?"——用这样的对话来讨论创作。这是巨大的变化。

所以,现在生成式AI做的事,当时叫 数据库艺术(Database Art)。互联网本来就是一个巨大的数据库、档案,基于此进行创作是计算机时代极具象征性的媒体形式,而现在其发展形态就是生成式AI。

核心观点:思考生成式AI时,重要的是:我们究竟从何时开始用计算机创作图像?从相机角度来说,何时开始使用数码相机?从这些连续问题的一部分来理解,至关重要。
数据库艺术的实践:Shredder 与 Net Art

当时所做的,其实是意义的解体。久保田说,20 世纪的意义解体是艺术的一大运动。在 20 世纪现代主义的影响下,数字时代到来时,发生的是意义的表彰与解体。

视频画面:Mike Napear 的著名网站 "Shredder",展示它如何解构多摩美术大学网页的原始数据

他举了一个具体例子:多摩美术大学的网页有一个叫 Shredder 的著名网站,作者是 Mike Napear。这个网站以各种方式解构浏览器中的原始数据——浏览器通常正确显示数据,但它能做的不止这些。Shredder 把元数据解体、拆散、再重构。久保田说,这个网站至今仍在运行,输入 URL 后就会这样分解。多摩美的 URL 就被这样当作数据库艺术来展示。

建议观看视频画面:Net Art、Soft Cinema、Database Cinema 的相关案例图片或网页截图

当时还有所谓的 Net Art(网络艺术)——在网页上写小说、故事,或者 Soft CinemaDatabase Cinema 等说法。这些都发生了。

当然当时正如刚才所说,还没有迎合人类喜好、读取语境解决问题的技术,所以首先就是把东西拆散再重构。但其基本原理其实并未改变太多。技术 refined(精炼)后,能做出美丽的东西,数据库对象变广,量的扩张是有的,但本质未变——这是 1998 年的事。

数字媒体的特征:分解与再重构

当时 MIT 建筑系的 William J. Mitchell 说,数字媒体的特征是分解与再重构。马诺维奇在《新媒体的语言》开头也提出了新媒体的原理:

  • 数值化表达(Numerical Representation)
  • 模块化(Modularity)
  • 自动化(Automation)
  • 可变性(Variability)
  • 转码(Transcoding)

久保田说,这些正是当今生成式AI的一个源流。

"生成"是一个陷阱:换成"预测"或"选择与操作"

久保田最后提出了一个方法论提示:生成式AI的"生成"其实是个陷阱。被"生成"迷惑,就会变成"是不是创作了什么东西"的问题。但如果不叫生成式AI而叫预测式AI,看起来会怎样?

或者更原始地说,就是"选择与操作"。用"选择与操作"来看,也许能不落俗套地思考问题。这对任何问题都很重要。

换个名字,问题就变了。

他的意思是:当我们把生成式AI理解为"选择数据、操作数据"时,关于作者性、创造性、艺术价值的讨论就会呈现出不同的面貌。这不是在贬低技术,而是在避免被"生成"这个词隐含的人类中心主义假设绑架。

第四块总结:生成式AI可以被理解为"数据集档案"——它不是保存原作的光晕,而是把作品特征压缩成可再生的数据。学习的本质是信息的压缩与扩张。再往前追溯到 1990 年代,生成式AI是"软件化"和"数据库艺术"的延伸:创作语言变成了软件参数语言,互联网成为创作的数据库,Shredder、Net Art 等实践已经把"分解与再重构"作为核心方法。马诺维奇提出的新媒体五原理(数值化、模块化、自动化、可变性、转码)至今仍是理解生成式AI的钥匙。最后,久保田提醒我们:"生成"是个陷阱,换成"预测"或"选择与操作",问题会变得更清晰。