距离 OpenAI 开始允许客户将 DALL-E 2 创建的图像用于商业用途仅几周时间,DALL-E 2 是其非常强大的 AI 文本到图像系统。但是,尽管目前存在技术限制和缺乏批量许可,更不用说 API,一些先驱者表示他们已经在测试系统的各种业务用例——等待 DALL-E 2 变得足够稳定以部署到生产中的那一天.
使用推荐算法个性化服装的在线服务 Stitch Fix 表示,它已经尝试使用 DALL-2 根据颜色、面料和款式等特定特征来可视化其产品。例如,如果 Stitch Fix 客户在试播期间要求“高腰、红色、有弹力、紧身牛仔裤”,则 DALL-E 2 被点击以生成该项目的图像,造型师可以使用这些图像与类似的Stitch Fix 库存中的产品。
一位发言人通过电子邮件告诉 TechCrunch:“DALL-E 2 帮助我们以视觉方式展示产品的信息量最大的特征,最终帮助造型师找到符合客户书面反馈要求的完美产品。”
来自 Stitch Fix 飞行员的 DALL-E 2 代。提示是:“柔软的橄榄绿色,颜色很好,有口袋,有图案,质地可爱,长款,开衫。”
当然,DALL-E 2 有一些怪癖——其中一些让早期的企业用户停下来。电子商务初创公司 Klaviyo 的数据科学副总裁 Eric Silberstein 在博客文章中概述了他对该系统作为潜在营销工具的不同印象。
他指出,由 DALL-E 2 生成的人体模型上的面部表情往往不恰当,肌肉和关节不成比例,而且系统并不总是能完全理解指令。当 Silberstein 要求 DALL-E 2 在灰色背景的木桌上创建蜡烛的图像时,DALL-E 2 有时会擦除蜡烛的盖子并将其混合到桌子上,或者在蜡烛周围添加一个不协调的边缘。
Silberstein 使用 DALL-E 2 进行产品可视化的实验。
“对于与人类的照片和人类建模产品的照片,它不能按原样使用,”西尔伯斯坦写道。不过,他说他会考虑使用 DALL-E 2 来完成一些任务,例如为编辑提供起点和向图形艺术家传达想法。 “对于没有人类的库存照片和没有特定品牌指南的插图,DALL·E 2,在我的非专家眼中,现在可以合理地取代’旧方式’,”Silberstein 继续说道。
Cosmopolitan 的编辑们在与数字艺术家 Karen X. Cheng 合作使用 DALL-E 2 为该杂志创建封面时得出了类似的 结论。到达最终封面时需要 Cheng 非常具体的提示,编辑们说这是说明性的DALL-E 2 作为艺术生成器的局限性。
但人工智能的怪异有时会起作用——作为一个特性,而不是一个错误。在其 Draw Ketchup活动中,Heinz 让 DALL-E 2 使用“番茄酱”、“番茄酱艺术”、“模糊番茄酱”、“太空中的番茄酱”和“番茄酱文艺复兴”等自然语言术语生成一系列番茄酱瓶图像。”该公司邀请粉丝发送他们自己的提示,这些提示是 Heinz 策划并在其社交渠道上分享的。
DALL-E 2“想象”的亨氏瓶子,这是亨氏最近的广告活动的一部分。
“随着人工智能图像在新闻和社交信息流中占据主导地位,我们看到了扩大我们的‘画番茄酱’活动的自然机会;根植于亨氏是番茄酱这个词的同义词的洞察力——在人工智能领域测试这一理论,”亨氏高级品牌经理 Jacqueline Chao 在一份新闻稿中说。
显然,当 AI 是主题时,DALL-E 2 驱动的活动可以发挥作用。但一些 DALL-E 2 业务用户表示,他们已经使用该系统生成不带有 AI 约束迹象的资产。
软件工程师 Jacob Martin 使用 DALL-E 2 为他正在开发的开源项目OctoSQL创建了一个徽标。大约 30 美元——大约是Fiverr 上标志设计服务的成本——马丁最终得到了一张章鱼的卡通形象,肉眼看起来像人类插图。
“最终结果并不理想,但我对此非常满意,”马丁在一篇博文中写道。 “就 DALL-E 2 而言,我认为现在对于大多数位和用途而言,它仍处于‘第一次迭代’阶段——主要的例外是铅笔草图;这些都非常好……我认为真正的突破将在 DALL-E 2 便宜 10 到 100 倍且速度更快时出现。”
使用 DALL-E 2 多次尝试后生成的 OctoSQL 徽标。
一位 DALL-E 2 用户——开发初创公司 Deephaven 的设计主管 Don McKenzie——将这个想法更进一步。他测试了应用该系统在公司博客上生成缩略图的想法,其动机是带有图像的帖子比没有图像的帖子获得更多的参与度。
“作为一个主要由工程师组成的小团队,我们没有时间或预算为我们的每一篇博客文章委托定制艺术品,”麦肯齐在一篇博客文章中写道。 “到目前为止,我们的方法是花 10 分钟从库存照片网站上滚动浏览相关但最终不合适的图像,下载一些不可怕的东西,把它放在前面,然后点击发布。”
在度过了一个周末并获得了 45 美元的积分后,McKenzie 说他能够用 DALL-E 2 生成的图像替换大约 100 篇博客文章。为了获得最好的结果,需要对提示进行摸索,但 McKenzie 说这是非常值得的。
“平均而言,我会说每篇博文需要几分钟和大约四到五个提示才能得到我满意的东西,”他写道。 “我们每个月都在库存图片上花费更多的金钱和时间,结果更糟。”
对于没有时间花在头脑风暴提示上的公司,已经有一家初创公司试图将 DALL-E 2 的资产生成能力商业化。 Unstock.ai建立在 DALL-E 2 之上,承诺“按需提供高质量的图像和插图”——目前是免费的。客户输入提示(例如,“碗中三条金鱼的顶视图”),然后选择首选样式(矢量艺术、逼真的、铅笔)来创建可以裁剪和调整大小的图像。
Unstock.ai 本质上自动化了即时工程,这是 AI 中的一个概念,旨在将任务描述嵌入文本中。这个想法是为人工智能系统提供详细的指令,以便它可靠地完成所要求的事情;一般来说,像“一个女人喝咖啡走路上班,长焦的电影剧照”这样的提示的结果会比“一个女人走路”更一致。
这可能是应用程序的预兆。当被联系征求意见时,OpenAI 拒绝分享有关 DALL-E 2 商业用户的数字。但有趣的是,需求似乎存在。 DALL-E 2 缺乏 API 的非官方变通办法已经在网络上涌现,由渴望将系统构建到应用程序、服务、网站甚至视频游戏中的开发人员串在一起。