Midjourney 6 宣告了摄影行业的终结

开放式AI
开放式AI
发布于 2024-08-18 / 18 阅读
0
0

Midjourney 6 宣告了摄影行业的终结

“有了 Midjourney 6,我的网站现在可以完全依赖 AI 图像了。”

一位大型独立在线出版商的这番话,应该会让任何摄影行业的人感到恐惧。

我同意这位出版商的观点。使用 Midjourney 的新版本 V6,最初并不会让人感到革命性。但一旦你深入挖掘,你就会意识到,这对人工智能生成图像来说是一个巨大的进步。

对于特定类型的照片,Midjourney 的输出确实将消除对人类摄影师的需求。以下是原因——以及摄影师必须如何适应。

AI 图像生成器的飞速发展

像 DALL-E 和 Midjourney 这样的 AI 图像生成器,在极短的时间内就变得非常强大。

我还清楚地记得,2019 年参加我的行业组织——数字媒体授权协会 (DMLA)——举办的一次会议。DMLA 邀请了来自 IBM 和微软等大型人工智能公司的专家,来谈论当时热门的人工智能话题:图像中物体的自动标记。

专家们确实谈到了这个话题。但在玛丽安德尔湾万豪酒店屋顶日光浴平台的午餐时间,四位人工智能专家选择坐在一起。我跟着他们,听他们聊天。

这些领先的人工智能研究人员和从业者在私下聊天时,在一件事上达成了共识:图像标记很酷,但给这项技术几年时间,它就能根据几句话生成新的图像。

当时,这似乎很可笑。人工智能图像生成还处于非常早期的阶段。OpenAI 要到两年后才会发布第一个版本的 DALL-E。即使在那时,人工智能图像生成器的初始输出也不是很令人印象深刻。

作为一名摄影师,很容易就能看到 2021 年像这样的 AI 图像示例,然后说:“不,这在短期内还无法取代人类。”

当然,专家们最终被证明是完全正确的。

在短短几年内,人工智能图像生成器突飞猛进,生成出的图像在细节、真实性和视觉冲击力方面都可与真实照片相媲美。

对于某些类型的图像,这种进步甚至更加显著。虽然早期的 AI 图像生成器在创建逼真的人脸特写图像方面表现出色,但它们最初难以创建更复杂的人物图像,使其看起来自然可信。

从 Midjourney V1(2022 年发布)到 Midjourney V5.1(截至 2023 年底的最新版本),以人为中心的图像的进步,简单地说明了这些图像已经发展到什么程度,以及发展速度有多快。

跨越恐怖谷

尽管取得了所有这些快速进步,但 Midjourney V5.1 的图像并不完美,甚至不一定是很有用。它们给人一种现实的感觉,但往往仍然缺少关键的细节。

例如,版本 5.1 难以逼真地渲染手。众所周知,人工智能生成的图像通常显示的人有六根手指、四根手指,或者根本没有手指。

尽管功能强大,但版本 5.1 创建的图像仍然带有一种卡通化的外观。

例如,这张由律师研究法律案件的照片,皮肤有一种天鹅绒般、类似动漫的效果,而且美学上过于戏剧化。

换句话说,这些图像看起来足够好,足以让我们在几分之一秒内认为它们可能是真的。

但一秒钟后,很明显它们有些不对劲。如果说有什么区别的话,那就是它们看起来比简单的插图或剪贴画还要糟糕。

接近现实——但又达不到——比坚持抽象更令人毛骨悚然。一只半写实的、手指漂浮的手,看起来比一只卡通化的、手指数量正确的手要恐怖得多。

简而言之,Midjourney 5.1 的图像常常陷入臭名昭著的“恐怖谷”。

“恐怖谷”一词最初是在 20 世纪 70 年代创造出来的,用来描述人类对类人机器人的反应。

这个概念很简单——人类对看起来像人的物体会越来越有亲近感,因为这些物体变得越来越逼真。但在某一时刻——当这个物体看起来几乎像真的一样,但又不是真的一样的时候——我们对它的喜爱就会突然跌落悬崖。

这就是为什么我们会觉得飞天小女警或玛吉·辛普森这样的角色很可爱,而我们会觉得维多利亚时代超逼真的儿童玩偶 creepy 到足以用它们来制作一整部恐怖电影系列。

具有夸张、程式化特征的类人物体,让人感觉友好可爱。那些看起来非常像人,但却达不到要求的物体,会让人觉得恐怖和可怕。

然而,关于恐怖谷最有趣的一点是,有一条明确的出路。一旦一个非人类物体的真实程度再高一点,我们就会回到喜欢这个物体的状态。事实上,我们非常喜欢它。

想想看,在当今最逼真的动画电影中,那些我们珍爱的、栩栩如生的角色。比如《冰雪奇缘》中的安娜和艾尔莎,或者(不出所料)《海洋奇缘》中的莫阿娜,她们看起来都足够真实,不会让人感到恐惧或不安。

如果说有什么区别的话,那就是它们以一种比现实更真实的方式,反映出我们的人性,夸大了我们喜欢的品质(大大的笑容、大大的眼球),并创造了一种瞬间的亲切感。

Midjourney 6 的突破

Midjourney 5.1 还在恐怖谷的深处挣扎,Midjourney 6 却戏剧性地从中走了出来。

同样,5.1 和 6 图像之间的差异,乍一看可能很微妙,尤其是对于更抽象或更艺术化的提示。让这两个系统生成一碗汤的照片,它们都能出色地完成任务。

但如果要求这两个系统生成人们实际购买和使用的图像类型——即人们渴望的人物图像——结果就会截然不同。

这一次,我们再来看看用 Midjourney 6 制作的遥控器照片。

遥控器看起来仍然有点不稳定。但手本身看起来好多了。首先,它的手指数量是正确的。但皮肤纹理和角质层的细节要逼真得多。

我们甚至可以看到一些微小的细节,比如拇指上细小的毛发,在远处电视机的灯光下清晰可见,这些细节在我们的脑海中尖叫着“人类”。

律师形象更具戏剧性。5.1 版本的动漫效果完全消失了。取而代之的是一张 99% 的观众都会误认为是真实的图像。

和安娜和艾尔莎一样,Midjourney V6 的图像看起来甚至比真实的图像还要好。我们这位假装的律师是个帅哥!

他那一丝不苟的头发和光滑的皮肤,如果没有化妆部门的帮助,在现实的照片拍摄中是很难做到的。

V5.1 图像的背景看起来像霍格沃茨,而 V6 图像的背景是模糊的、看起来很重的法律书籍,很有品味。如果这张照片出现在法学院的宣传册上,我们可能会忍不住想去那里。

事实上,这正是我在自己使用 Midjourney V6 图像进行广告宣传的实验中发现的。Midjourney 那些人们渴望的人物图像,比真人图像的转化率更高。顾客对它们爱不释手。

摄影师如何应对?

这对那些以使用演员和场景创作或销售简单的、人们渴望的照片为生的人来说,是一个巨大的问题。

雇佣模特、租赁法律图书馆(或在摄影棚里搭建一个假的)、购买服装、安装合适的灯光以及购买专业相机设备,这些成本高昂,而且需要数周时间。

用 AI 变出一位假律师,根本不需要任何成本,而且大约需要 15 秒钟。

如果要在昂贵且劳动密集型的照片拍摄和 AI 之间做出选择,大多数寻求库存图像的客户会选择后者,正如我的出版商朋友的评论所暗示的那样。

以前,Midjourney 的细微错误,使得该系统以人为中心的图像基本上无法使用。现在,它们可能还不完美,但已经足够好了。

在商业领域,“足够好”总是能赢。

那么这对摄影师来说意味着什么呢?如果你的职业生涯是围绕着使用演员和场景创作或销售舞台化的库存照片,那么是时候重新评估你的商业模式了。

目前,Midjourney 受制于其不稳定的界面,它需要下载一个以游戏玩家为中心的聊天应用程序,并向一个用图像回复的机器人发送命令行消息。

然而,随着该系统的技术障碍被消除,以及 DALL-E 等更人性化的图像生成器的进步,像 V6 这样的图像将突然出现在任何地方。

需要明确的是,这并不意味着商业摄影的终结。但这确实意味着改变。以下是我的一些预测:

  • 传统库存图片的价格将继续长期走向 0 美元。
  • 鉴于它们的转化率如此之高,广告商将倾向于使用 AI 图像。
  • 用于报纸、杂志和许多书籍的编辑图片,其价值将会飙升。这些图片是由像我这样的摄影师拍摄的,他们遵循关于真实性和准确性的严格规则。在一个充斥着虚假 AI 图像的世界里,编辑照片的真实性,将成为某些类型客户更加热门的商品。
  • 人为创建的商业库存图片,将继续存在一个利基市场,因为一些品牌永远不会接受 AI。但这个利基市场将会很小,而且将由知名摄影师或与品牌有深厚现有关系的摄影师主导。
  • 在现实世界中拍摄的特定事件的照片,将保持其价值,甚至会升值。没有人想要一张 AI 生成的婚礼照片。事件摄影师可以松一口气了。

人工智能图像生成器在极短的时间内取得了巨大的进步,但它们细微的错误限制了它们在现实世界中的影响。

如今,这些系统正在一个接一个地走出恐怖谷,从牛油果椅子或衣冠楚楚的律师开始。摄影将不再是原来的样子。

摄影师的未来在哪里?

面对 AI 的冲击,摄影师需要积极转型,才能在未来立于不败之地。以下是一些可供参考的方向:

1. 专注于真实事件和人物摄影

正如前文所述,婚礼、会议、体育赛事等真实事件的摄影,依然是 AI 难以取代的领域。捕捉真实瞬间、情感和氛围,是人类摄影师独有的优势。

此外,肖像摄影也可以聚焦于真实人物的故事和个性,而非仅仅追求完美的样貌。通过与拍摄对象深入沟通,挖掘其内在魅力,创造出 AI 无法复制的作品。

2. 提升创意和艺术价值

AI 可以生成逼真的图像,但缺乏创意和艺术感。摄影师可以利用自身的美学素养和创作理念,突破传统摄影的边界,探索更具实验性和艺术性的表达方式。

例如,可以尝试抽象摄影、观念摄影、混合媒介等形式,将摄影作品提升到艺术品的高度,吸引收藏家和艺术爱好者的关注。

3. 提供专业化的摄影服务

除了拍摄照片,摄影师还可以提供更全面的服务,例如:

  • 前期策划: 根据客户需求,制定拍摄方案,包括主题、风格、场景、服装等。
  • 后期制作: 对照片进行精修、调色、合成等处理,提升视觉效果。
  • 影像输出: 根据客户需求,将照片制作成相册、画册、海报等形式。

通过提供专业化的服务,摄影师可以与客户建立更紧密的合作关系,提升自身价值。

4. 拥抱新技术,与 AI 协同发展

AI 不仅仅是竞争对手,也可以成为摄影师的工具。例如,可以使用 AI 图像生成器获取创作灵感,或辅助完成部分后期工作,提高工作效率。

此外,还可以学习 AI 相关的知识和技能,例如图像识别、机器学习等,将其应用于摄影创作和商业实践中。

总而言之,AI 的发展给摄影行业带来了挑战,也带来了机遇。摄影师只有不断学习、创新和转型,才能在 AI 时代继续保持竞争力,创造出更多精彩的影像作品。


评论