/包括 Stitch Fix 在内的企业已经在试验 DALL-E 2

包括 Stitch Fix 在内的企业已经在试验 DALL-E 2

图片来源:OpenAI

 OpenAI 已经开始允许客户商业使用由 DALL-E 2 创建的图像, DALL-E 2 是其非常强大的 AI 文本到图像系统。尽管目前存在技术限制并且缺乏批量许可,更不用说 API,一些用户表示他们已经在针对各种业务去测试该系统——等到 DALL-E 2 变得足够稳定,足以部署到生产中的那一天.

Stitch Fix 是一家使用推荐算法对服装进行个性化定制的在线服务公司,该公司表示已尝试使用 DALL-E 2 根据颜色、面料和款式等特定特征可视化其产品。例如,如果 Stitch Fix 客户在试用期间要求“高腰、红色、有弹性、紧身牛仔裤”,则 DALL-E 2 会根据关键自动生成该项目的图像,造型师可以使用这些图像来匹配类似的产品Stitch Fix 库存中的产品。

一位发言人通过电子邮件告诉 TechCrunch:“DALL-E 2 帮助我们以视觉方式展示产品最丰富的特征,最终帮助造型师找到符合客户要求的完美产品。”

来自 Stitch Fix 飞行员的 DALL-E 2 代。提示是:“柔软,橄榄绿,颜色很棒,口袋,有图案,质地可爱,长款,开衫。” 图片来源:OpenAI

当然,DALL-E 2 有一些怪癖——其中一些让早期的企业用户犹豫不决。电子商务初创公司 Klaviyo 的数据科学副总裁 Eric Silberstein 在博客文章中概述了他对该系统作为潜在营销工具的复杂印象。

他指出,DALL-E 2 生成的人体模型的面部表情往往有点奇怪,肌肉和关节也不成比例,而且该系统并不总是能完全理解指令。当 Silberstein 要求 DALL-E 2 在灰色背景下创建木桌上的蜡烛图像时,DALL-E 2 有时会擦掉蜡烛的盖子并将其融入桌子或在蜡烛周围添加不协调的边缘。

Silberstein 使用 DALL-E 2 进行产品可视化的实验。图片来源:OpenAI

“对于有人物的照片和人体模型产品的照片,它不能按原样使用,”西尔伯斯坦写道。不过,他说他会考虑使用 DALL-E 2 来完成诸如提供编辑起点和向图形艺术家传达想法等任务。“对于没有人物的库存照片和没有特定品牌指南的插图,在我非专家看来,DALL·E 2 现在可以合理地取代‘旧方法’,”Silberstein 继续说道。

Cosmopolitan 的编辑们在与数字艺术家 Karen X. Cheng 合作使用 DALL-E 2 为该杂志创作封面时得出了类似的结论。最终封面得到了 Cheng 非常具体的提示,编辑们说这是说明性的DALL-E 2 作为艺术生成器的局限性。

但 AI 的怪异有时会起作用——作为一个功能,而不是一个错误。对于 Draw Ketchup活动,Heinz 让 DALL-E 2 使用自然语言术语生成一系列番茄酱瓶图像,例如“番茄酱”、“番茄酱艺术”、“模糊番茄酱”、“太空番茄酱”和“番茄酱复兴”。该公司邀请粉丝发送他们自己的提示,这些提示由亨氏策划并在其社交渠道上分享。

亨氏瓶装由 DALL-E 2“想象”出来,这是亨氏最近广告活动的一部分。图片来源:OpenAI

“随着 AI 图像在新闻和社交媒体中占据主导地位,我们看到了扩展‘Draw Ketchup’活动的自然机会;植根于亨氏与番茄酱这个词同义的洞察力——在人工智能领域检验这一理论,”亨氏高级品牌经理 Jacqueline Chao 在一份新闻稿中说。

显然,当以 AI 为主题时,DALL-E 2 驱动的活动可以奏效。但一些 DALL-E 2 商业用户表示,他们已经利用该系统生成了不带有 AI 限制迹象的资产。

软件工程师 Jacob Martin 使用 DALL-E 2 为他正在开发的开源项目OctoSQL创建徽标。大约 30 美元——大约是Fiverr 上标志设计服务的费用——Martin 最终得到了一个肉眼看起来像人类插图的章鱼卡通形象。

“最终结果并不理想,但我对此非常满意,”马丁在一篇博文中写道。“就 DALL-E 2 而言,我认为现在对于大多数位和目的而言,它仍然处于“第一次迭代”阶段——主要的例外是铅笔素描;这些都非常好……我认为真正的突破将在 DALL-E 2 的价格和速度降低 10 到 100 倍时到来。”

OctoSQL 徽标,在使用 DALL-E 2 进行多次尝试后生成。图片来源:OpenAI

DALL-E 2 的一位用户——开发初创公司 Deephaven 的设计主管 Don McKenzie——将这个想法更进一步。他测试了应用该系统在公司的博客上生成缩略图的想法,其动机是带有图片的帖子比没有图片的帖子更吸引人。

“作为一个主要由工程师组成的小团队,我们没有时间或预算为我们的每一篇博文委托定制艺术品,”McKenzie 在博文中写道。“到目前为止,我们的方法是花 10 分钟从图库网站上滚动浏览一些无关紧要但最终不合适的图片,下载一些还不错的东西,将其放在首页并点击发布。”

在度过一个周末并获得 45 美元的积分后,McKenzie 说他能够用 DALL-E 2 生成的图像替换 100 篇左右的博客文章。为了获得最佳结果,需要根据提示进行修改,但麦肯齐说,这是非常值得的。

“平均而言,我会说每篇博客文章需要几分钟和大约四到五个提示才能得到我满意的东西,”他写道。“我们每个月在股票图片上花费更多的金钱和时间,结果更糟。”

对于没有时间花在头脑风暴提示上的公司,已经有一家初创公司试图将 DALL-E 2 的资产生成功能商业化。Unstock.ai建立在 DALL-E 2 之上,承诺“按需提供高质量的图像和插图”——目前免费。客户输入提示(例如,“碗中三只金鱼的俯视图”),然后选择喜欢的风格(矢量艺术、照片写实、铅笔)来创建图像,这些图像可以被裁剪和调整大小。

Unstock.ai 本质上是自动化提示工程,这是 AI 中的一个概念,旨在将任务描述嵌入文本中。这个想法是为人工智能系统提供详细的指令,以便它可靠地完成被要求的事情;一般来说,像“一个女人喝咖啡,走路去上班”这样的提示的结果会比“一个女人走路”更一致。

这可能预示着即将到来的应用程序。当联系 OpenAI 征求意见时,OpenAI 拒绝分享有关 DALL-E 2 商业用户的数字。但有趣的是,需求似乎是存在的。DALL-E 2 缺乏 API 的非官方变通办法已经在网络上如雨后春笋般涌现,将系统构建和应用程序、服务、网站甚至视频游戏中的开发人员串在一起。

   
   
   
           

大作社是大作旗下综合设计资讯社区,

多重视角共同探索全球设计文化,

关注我们,每天有你好看。


   
   

   
   

 

本文来自微信公众号“大作社”(ID:MasterOpenEye)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。