Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

现在任何人都可以构建使用 DALL-E 2 生成图像的应用程序

Posted on 2022-11-04

终于,OpenAI 的图像生成 AI 系统DALL-E 2可作为 API 使用,这意味着开发人员可以将系统构建到他们的应用程序、网站和服务中。在今天的一篇博客文章中,OpenAI 宣布任何开发人员只要创建一个 OpenAI API 帐户作为公开测试版。

DALL-E 2 API 的定价因分辨率而异。对于 1024×1024 图像,每张图像的成本为 0.02 美元; 512×512 图像每张图像 0.018 美元; 256×256 图像每张图像 0.016 美元。与 OpenAI 的企业团队合作的公司可以享受批量折扣。

与 DALL-E 2 测试版一样,该 API 将允许用户根据文本提示生成新图像(例如“一只毛茸茸的兔子在花丛中跳跃”)或编辑现有图像。微软是 OpenAI 的密切合作伙伴,它正在 Bing 和 Microsoft Edge 中利用其Image Creator工具来利用它,如果网络结果没有返回他们正在寻找的内容,该工具可以让用户创建图像。时装设计应用 CALA 正在使用 DALL-E 2 API 作为一种工具,该工具允许客户从文本描述或图像中提炼设计理念,而照片初创公司 Mixtiles 则将其引入到其用户的艺术创作流程中。

随着 API 的推出,政策方面的变化不大,这可能会让那些担心像 DALL-E 2 这样的生成 AI 系统在没有充分考虑它们所带来的道德和法律问题的情况下发布的人感到失望。和以前一样,用户受 OpenAI 服务条款的约束,该条款禁止使用 DALL-E 2 生成明显暴力、色情或仇恨的内容。 OpenAI 还继续阻止用户在未经他们同意的情况下上传人的图片或他们无权上传的图片,并采用自动和人工监控系统相结合的方式来执行此操作。

一个细微的调整是使用 API 生成的图像不需要包含水印。 OpenAI 在 DALL-E 2 测试版中引入了水印,作为指示哪些图像来自系统的一种方式,但随着 API 的推出,它选择了使其成为可选。

“我们鼓励开发人员披露图像是 AI 生成的,但不要求它们包含 DALL-E 2 签名,”负责 DALL-E 2 开发的 OpenAI 产品经理 Luke Miller 通过电子邮件告诉 TechCrunch。

Microsoft 的 Designer 工具,由 DALL-E 2 API 提供支持。

Microsoft 的 Designer 工具,由 DALL-E 2 API 提供支持。

OpenAI 还使用 DALL-E 2 的提示和图像级过滤器,尽管一些客户抱怨过滤器过于热心和不准确。该公司已将部分研究工作集中在使 DALL-E 2 生成的图像类型多样化上,旨在消除已知文本到图像 AI 系统成为受害者的偏见(例如,主要生成白色图像)当提示“CEO 的例子”之类的文字时,男性)。

但这些步骤并没有平息所有批评者。 8 月,在 Newgrounds、PurplePort 和 FurAffinity 等网站做出类似决定后,Getty Images 禁止上传和销售使用 DALL-E 2 和其他此类工具生成的插图。 Getty Images 首席执行官 Craig Peters 告诉 The Verge,该禁令是出于对“未解决的权利问题”的担忧,因为 DALL-E 2 等系统的训练数据集包含从网络上抓取的受版权保护的图像。

许多评论家表示,他们担心 DALL-E 2 的不仅仅是商标作品的侵权。他们认为,该系统威胁到现在可以用几行文字复制风格的艺术家的生计,包括不同意的艺术家他们的工作被用于 DALL-E 2 的训练。 (为了对 OpenAI 公平起见,该公司已经授权了 DALL-E 2 训练数据集中的部分图像,这比它的一些竞争对手还多。)

Getty Images 的竞争对手 Shutterstock 试图找到中间立场,最近宣布将开始使用 DALL-E 2 生成内容,但同时启动“贡献基金”,以在公司出售训练文本到图像 AI 系统的工作时向创作者提供补偿.它还禁止第三方上传人工智能艺术,以最大限度地减少受版权保护的作品进入平台的可能性。

技术专家 Mat Dryhurst 和 Holly Herndon 正在带头开展一项名为Source+的工作,以允许人们禁止将他们的工作或肖像用于 AI 培训目的。但这是自愿的。 OpenAI 没有说它是否会参与——或者实际上,它是否会引入一种自助服务工具,允许权利人将他们的工作排除在培训或内容生成之外。

Mixtiles DALL-E 2 API

Mixtiles 是 DALL-E 2 API 的早期采用者之一。

在一次采访中,米勒几乎没有透露有关新缓解措施的具体细节,只是 OpenAI 一直在改进其技术以防止系统生成客户可能会反感的有偏见、有毒和其他令人反感的内容。他将开放 API 测试版描述为一个“迭代”过程,随着 OpenAI 扩展为 DALL-E 2 提供动力的基础设施,未来几个月将涉及与“用户和艺术家”的合作。

当然,如果 DALL-E 2 beta 有任何迹象,API 程序将随着时间的推移而发展。早期,OpenAI 禁用了使用 DALL-E 2 编辑人脸的功能,但后来在改进其安全系统后启用了该功能。

“我们在这方面做了很多工作——通过您上传的图像和您发送的提示,以使它们与我们的内容政策保持一致,并采用不同的缓解措施以在提示级别和以图像级别,以确保符合我们的内容政策。因此,例如,如果有人要上传包含仇恨符号或血腥的图像——比如非常、非常、非常暴力的内容——就会被拒绝,”米勒说。 “我们一直在思考如何改进系统。”

但是,虽然 OpenAI 似乎急于避免围绕 Stable Diffusion 的争议,它是 DALL-E 2 的开源等价物,已被用于创建色情、 血腥和名人 deepfakes ,它让 API 用户来决定如何以及在何处部署它的技术。微软等一些公司无疑会采取谨慎的方法,缓慢推出由 DALL-E 2 驱动的产品以收集反馈。其他人会一头扎进,拥抱技术和随之而来的道德困境。

如果有一件事是肯定的,那就是对生成人工智能的需求被压抑——后果是该死的。甚至在 API 正式可用之前,开发人员就已经发布了将 DALL-E 2 集成到应用程序、服务、网站甚至视频游戏中的变通方法。在 OpenAI 强大的营销力量的推动下,随着公开测试版的发布,合成图像有望真正进入主流。

现在任何人都可以构建使用 DALL-E 2 生成图像的应用程序,由Kyle Wiggers最初发布在TechCrunch上

原文: https://techcrunch.com/2022/11/03/now-anyone-can-build-apps-that-use-dall-e-2-to-generate-images/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme