Vim

November 5, 2022

你以为的创造力可能只是体力活,但不用怕……

今年 AI-GC(AI Generated Content)领域大火,似乎一夜之间就各个领域——图像、视频、音频、文字、人物形象——都涌现出几乎开箱即用的人工智能驱动的内容生产产品。在自己亲自试用了若干之后,对其效果叹为观止。

以营销写作生产工具 copy.ai 为例。我试着将想表达的观点输入:

640.png


然后 copy.ai 生成的内容如下

640 (1).png


基于我输入的信息而生成的内容,在我看来已经足以让人能够沿着这个框架继续创作。我相信,当我想表达的内容拥有更细腻的表达时,最终生成的内容的质量会大幅度提升。但我的惊奇只持续了一小会儿时间,然后问了自己这样一个问题

这些 AI 真的具备创造力了吗?

先转发一段硅发布援引的观点:

生成式 AI 提醒我们,很难做出有关于人工智能的预测。十年前,传统观点认为:人工智能首先会影响体力劳动;然后,是认知劳动;然后,也许有一天它可以做创造性工作。现在看起来,它会以相反的顺序进行。”——Sam Altman
Lynn Yang,公众号:硅发布
为什么生成式AI这么火?OpenAI刚刚被曝估值已接近200亿美金

现在回顾这个观点,会质疑那个「十年前的观点」生成的底层逻辑:人工智能的生存土壤是一个完全的信息世界,如果要预测其施展最大影响力的领域,显然应该是「纯信息领域」。现在的发展事实并没有按所谓的「以相反的顺序进行」,而是过去几年 AI 领域的积累形成的大爆发。换言之,是一种正确的顺序。而这个顺序在过去十年间已经在我们身边匍匐前进了很久。譬如:

  • Instagram 的滤镜
  • 抖音里多张图片一键生成配乐视频
  • PPT 里面的自动排版

这些都有着类似的产品形态:用户选择要处理的对象,通过预设的规则一键生成自己喜欢的风格。相比现在的通过输入描述性文字生成指定内容,这个前 AI-GC 领域可以称为:AI-IC(AI Improved Content)。而最近几年 AI 的发展,尤其 OpenAI 之后,创作的起点可是越来越抽象:从模板演进到了文字。我相信按照这样的速度,图像再生成图像,语音再生成语音,视频再生成视频都是可以期待的未来。

那这是否意味着创意工作者们赖以生存的技艺在未来不再有效?我认为是的。悲观地估计,可能现在被认为属于创意工作的 90% 的所谓技能包将不再被需要。就像颜料管发明之后(紧跟着标准色的建立),让画家不再需要自行调配颜料;照相术发明之后传统的肖像绘画在功能上就没有任何价值了一样;Photoshop 代表的数字暗房让传统的胶片技艺几近失传。

但这是否意味着不再需要创意工作者了?显然又不是。就像照相机催生了表达观念的抽象艺术;电影突破了舞台的限制,蒙太奇突破了叙事的结构;即使是文字范畴的小说,我们都能看到古典时代-现代-后现代之间的巨大差别。我相信在 AI-GC 的台阶上会产生新的创意形式以及新的创意工作者。

的确,千篇一律的 Banner 应该不需要人来创作了,只是堆砌词藻的营销软文也能自动生成了,甚至一些套路化的视频拍摄也可能只需要素材而不再需要人为的调度,具有独特声线的嗓音都可以由人为设计、自动化地批量生产。这些在 AI-GC 之前还能被称为有创意的工作,在触手可及的新范式下都是体力活动,都是可替代的。

那不可替代的是什么呢?我觉得是表达的能力,制造理念的能力,想象及叙事的能力。如果你在一个 AI 生成图像的工具中敲入以下语句:一个毛茸茸的可爱动物,脸像猫,身体却像大象,在一个宫崎骏风格的树林里,正在等待太阳升起。这句看似普通的指令里,有很多我们习以为常但其实背后凝聚着对于计算机来说非常难以理解的内容。

「可爱」是没有概念性定义的,只有描述性定义。
就像何为红色何为绿色。我们无法获得一个唯一准确的关于可爱是什么的参数,只有你我各自对「可爱」有了自己的理解,再力求双方之间的共识。而且这个共识可能永远没法获得普世层面的共识。这就留出人类表达的空间,甚至可能会产生之前未曾有过的表达方式。我甚至推测,AI GC 的时代会比之前出现更多的「梗」、「黑话」。当写/说/画/拍/造什么不再需要经年累月的练习的时候,用于描述 写/说/话/拍/造什么 能力会被剧烈地放大。

「宫崎骏风格」是一个需要理解的人造理念,也是人为构建的表达方式。
看过宫崎骏电影的人们,可能对什么是「宫崎骏风格」会有一个模糊的想象。当用户看到基于这个词汇产生的图像甚至视频后,才会作出一个判断「对,就是这个味道!」但需要知道的是,这个概念是人为创造出来的,只有有了宫崎骏的创作作品,才有了可以进行训练的数据集,才产生了所谓「宫崎骏风格」的内容。AI 在这个层面上,并没有理念的原创性,它的最大价值可以说是直接抹平了「语言-表现」之间的鸿沟:你只要知道某个理念,你就能生成基于这个理念的作品。

而这两者交织成了想象及叙事的能力。
目前看,AI 把人类将点状的想法变为实际的内容这个能力已经突破了桎梏,朝着不断完善的方向上一路狂奔。可能有人会感到绝望,而我依然选择乐观。而这个乐观恰恰源自人类想象和叙事的潜能,甚至再准确的描述是:人本身的缺陷及其会造成的意外。算法可以让机器在国际象棋、围棋上完胜人类,但创造不了 3D 国际象棋;算法可以让描述的内容惟妙惟肖,却无法构建一拳超人漫画中独特的世界观。算法可以触碰到理性的极限,而人的世界最动人的却是非理性。


对于人工智能的可能性,我们需要再次回望图灵在上个世纪 30 年代中期思考的三个问题:

  1. 世界上是否所有数学问题都有明确的答案?

  2. 如果有明确的答案,是否可以通过有限步骤的计算得到答案?

  3. 对于那些有可能在有限步骤计算出来的数学问题,能否有一种假想的机械,让它不断运动,最后当机器停下来的时候,那个数学问题就解决了?

图灵基于以上思考而设计的方法,是一个数学模型,后人称呼它为图灵机。今天所有的计算机,包括全世界正在设计的新的计算机,从解决问题的能力来讲,都没有超出图灵机的范畴。到此为止,图灵其实为今天的计算机和很长时间以后的未来计算机所能解决的问题划了一条不可超越的边界。

参考吴军老师在其得到课程中的总结:


  1. 世界上有很多问题,其中只有一小部分是数学问题;
  2. 在数学问题中,只有一小部分是有解的;
  3. 在有解的问题中,只有一部分是理想状态的图灵机可以解决的;
  4. 在后一类的问题中,又只有一部分是今天实际的计算机可以解决的;
  5. 而人工智能可以解决的问题,又只是计算机可以解决问题的一部分。


我把这个嵌套逻辑画成了下面这张图,从图中可以看到,人工智能所能解决的问题真的只是世界上问题的很小一部分。对于人工智能来讲,我倒是觉得现在世界上没有解决的问题太多,无论是人还是机器(其实是它们背后编写程序的人),都应该想办法解决各种问题,而不是杞人忧天,担心人工智能这个工具太强大了。

IMG_0141.JPG


AI 作为一种前所未有的生产力,就像人类历史上的技术突破——印刷术、蒸汽机、照相机、集成电路、互联网——一样,会以一种完全没有历史经验可以遵循的方式将世界往前推进,我们唯有拥抱、适应、改变。

Let's boldly go where no man/one has gone before.

-------------

附上基于:a cute hairy animal which its face is like cat and body is like elphant is waiting the sunrise in the woods that looks like a Miyazaki Hayao film style. 的图片。Generated by Midjourney

vim_a_cute_hairy_animal_which_its_face_is_like_cat_and_body_is__f67c4c09-b14a-411b-988d-322e.png