Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

一家初创公司对提供给 DALL-E 2 的文本字符串收取 1.99 美元的费用

Posted on 2022-07-30

通过 OpenAI 的 DALL-E 2 等 AI 系统找出正确的文本提示以产生最佳结果本身已成为一门科学。现在,一家初创公司正在寻求让“即时工程师”通过销售这些经过微调的短语的在线市场获利。

于 6 月推出的PromptBase允许用户出售通过特定系统获得可预测结果的单词串。价格为 1.99 美元——PromptBase 抽成 20%——提示生成的内容范围从“病毒式”标题到运动队标志、针织娃娃和穿西装的动物的图片。

目前,PromptBase 仅托管在 DALL-E 2 和 GPT-3 上测试的提示。但根据其创始人 Ben Stokes 的说法,该计划是在未来将该平台扩展到其他系统。

“我们的最终目标是构建工具以帮助支持即时工程师。现在还为时过早,所以我们目前只是试图宣传并寻找提示工程师注册并开始在我们的市场上列出他们的提示出售,“斯托克斯通过电子邮件告诉 TechCrunch。 “我们已经看到大型科技公司构建了自己的类似于 GPT-3 和 DALL-E 的系统,我预计还会有更多。不同的系统可能会像工具带中的工具一样被使用,类似于当今使用不同编程语言的方式,我们计划在它们越来越受欢迎时适应所有这些。”

提示库

用户可以在 PromptBase 的市场上买卖 AI 系统的提示。图片来源: PromptBase

销售提示并不违反任何人工智能提供商的服务条款,但它可能会根据所销售提示的性质打开一系列道德和法律的蠕虫。此外,它揭示了即使是当今可用的最强大的人工智能系统的脆弱性和不可预测性。

即时工程

提示工程是 AI 中的一个概念,旨在将任务描述(如生成毛茸茸生物的艺术)嵌入文本中。这个想法是提供一个人工智能系统“指南”或详细说明,以便它利用它对世界的了解,可靠地完成被要求的事情。一般来说,像“一个女人喝咖啡走路上班,长焦的电影剧照”这样的提示的结果会比“一个女人走路”更一致。

例如,提示可用于教图像生成系统区分“包含土豆的图像”和“土豆的集合”。它们还可以充当各种“过滤器”,创建具有素描、绘画、纹理、动画甚至特定插画家(例如莫里斯·森达克)特征的图像。提示可以用不同的风格描绘同一主题,例如“儿童画的考拉骑自行车”和“考拉骑自行车的老照片”。

提示可能非常细微。由于人工智能系统理解图像和文本中的模式的方式,并非所有这些都具有可预测的——甚至是合理的——结构。例如,与“瀑布旁边的山非常非常漂亮的画”相比,使用 DALL-E 2 的提示“瀑布旁边的山非常漂亮的画”返回的结果更差。原因?系统对“非常”这个词赋予了极高的价值。

值得注意的是,“非常”示例特定于 DALL-E 2 的特定迭代,并且很可能不适用于另一个。但这是即时工程有价值的一个主要原因:发现边缘情况。

语言条件模型的作用有点像决策转换器,因为您可以用所需的“奖励”水平来提示它们。

例如,想要更漂亮的#dalle创作吗?通过添加“[非常]^n 美丽”来“问”:

n=0:“瀑布旁山的美丽画作。” pic.twitter.com/vu0NceTxAv

——菲利普·伊索拉 (@phillip_isola) 2022 年 6 月 2 日

在德克萨斯大学奥斯汀分校的一项引人入胜的 研究中,研究人员记录了可用于使用 DALL-E 2 生成图像的大量奇异提示词汇。他们发现该系统可以理解“Apoploe vesrreaitais”——一个胡言乱语的短语——以意思是“鸟”,“Contarra ccetnxniams luryca tanniounons”意思是“虫子”或“害虫”(有时)。给 DALL-E 2 提示“Apoploe vesrreaitais 吃 Contarra ccetnxniams luryca tanniounons”会产生鸟类吃虫子的照片。

尽管这些无意义的词可能与系统中的一些内部逻辑相对应,但这就是为什么一些数据科学家将提示比作“咒语”或“魔法词”——以及为什么提示工程催化了整个学术研究领域。

有问题的提示

许多研究人员和爱好者已经发布了免费资源,其中包含流行 AI 系统的提示,主要是 DALL-E 2。PromptBase 是最早将交易所货币化的公司之一——它已经受到了批评。人工智能社区内部一直存在着关于哪些研究(如果有的话)应该或可以商业化的争论。一位 Reddit 用户认为,PromptBase 正在“开启一种威胁人工智能开放性和可访问性的趋势”。

但斯托克斯为这个模型辩护,认为 PromptBase 上的许多提示代表了工程师真正的工作时间和洞察力。

“今天我们有生成基本文本和图像的提示,但不难推断未来几年我们会有生成视频的提示,也许有朝一日甚至长篇电影都配有管弦乐配乐,”斯托克斯补充道. “那些能够制作所需的质量提示的人会指导人工智能做这些事情,这将非常有价值。目前尚不清楚市场会有多大,但我可以看到它是一项关键的技术技能,如果不是编程的未来的话。”

当然,没有什么可以阻止 PromptBase 客户在购买后发布即时消息。但这可能是 PromptBase 的最小问题。

研究表明,在大量公共数据(如 GPT-3)上训练的语言系统可以在输入某些提示时“泄露”个人信息,包括姓名和地址。一些提示可能会鼓励侵犯版权,例如指示 DALL-E 2 生成“神奇宝贝的 3D 模型”。研究人员推测,其他方法可用于击败单词级过滤器,以使图像生成系统输出“受限”图像,例如暴力图像(例如,“一匹马躺在红色液体的水坑中”)。

探索 Dall-e 2:关于其理解不同语言、拼写错误和其他一些发现的能力的线索。

显然,其他语言的提示有点可靠,尽管不如英语可靠。有时它不会输出你想要的,但这是可以解释的pic.twitter.com/UZoii1rVNc

— 伊戈尔·拜科夫?? (@Killa_ru) 2022 年 6 月 7 日

Stokes 表示,PromptBase 会审查市场上的每个列表,以确保它们不违反任何“人工智能生成规则”。但如果业务增长,维持这种审查水平可能会变得更加困难。

德国萨尔州学院的计算语言学家 Vagrant Gautam 同意存在滥用的可能性。然而,她也指出,快速的市场可以为艺术家和其他有创造力或擅长调试的人提供收入机会。

“[它指出] 即时工程的重要性,以及参与其中的技能的重要性——创造力、时间、对抗性思维等。很多人一直在说 DALL-E 2 即将推出为了让他们能够轻松地生成他们想要的任何图像或艺术,他们发现这样做是一门艺术,而且通常需要多次尝试,”Gautam 说。

鉴于 DALL-E 2 等系统并非完全免费使用,因此这些尝试可能会变得昂贵。斯托克斯本人表示,他付出了“财富”,试图在他的另一家企业Paper Website中找到 GPT-3 的提示。

提示库

图片来源: PromptBase

“人们现在也抱怨它的货币化,因为他们说在你必须开始支付之前调整你的提示的机会太少了,”Gautam 继续说道。 “我觉得这很有趣——人们必须采取这种反复试验、对抗性的方法来弄清楚如何促使生成模型做他们想做的事情。”

在商业化的即时工程中尘埃落定还需要一段时间。但如果不出意外,PromptBase 将提出——并且已经提出——围绕着将改变无数行业的人工智能系统的问题。

原文: https://techcrunch.com/2022/07/29/a-startup-is-charging-1-99-for-strings-of-text-to-feed-to-dall-e-2/

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Alin Panaitiu
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brent Simmons
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • PostHog
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Slava Akhmechet
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2026 搞英语 → 看世界 | Design: Newspaperly WordPress Theme