Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

什么是生成式人工智能及其工作原理?

Posted on 2024-12-28

生成式人工智能是指使用机器学习模型来创建内容的技术。机器学习模型是寻求复制人类智能各个方面的计算机程序。

这些模型可以生成各种内容格式,包括代码、文本、视觉效果、音频和视频。

各种程序都有能力学习几乎任何类型的信息。

例如,不同的生成式人工智能模型可以理解编码、视觉、科学和人类语言。

OpenAI 的ChatGPT是理解和生成文本内容的模型的一个流行示例。

在本文中,我们将探讨该工具和其他一代人工智能工具的工作原理。

生成式人工智能的工作原理

Gen AI 使用现有材料库来生成原创内容。以下是该过程的工作原理。

第 1 步:用户提供提示

该技术根据用户提示生成内容。

根据您使用的工具,您也许能够输入自由格式的基于文本的提示。

假设您要为新的电子商务项目生成描述。

一个简单的ChatGPT 提示可能如下所示:

“为 [插入产品详细信息] 编写 100 字的产品描述。使用友好、乐观的语气。”

一些人工智能工具使用参数而不是自由格式输入。

例如,Semrush 的Ecommerce Booster应用程序根据关键字、文本长度、可读性、语气和格式设置生成广告描述。

semrush-ecommerce-booster.png

第 2 步:生成式 AI 模型生成内容

一旦系统收到用户的提示,它就会使用机器学习模型来生成内容。

这些模型使用可能包含数十亿条现有内容的库进行训练。

在训练时,模型会学习现有内容的组成部分和结构。然后,他们利用所学到的知识来生成“新”材料。 (它并不是真正的新内容,因为它完全基于现有内容。)

内容生成过程的机制有所不同,具体取决于输出的类型。

一些最常见的模型包括:

  • 大型语言模型 (LLM):使用大型数据集来预测一段内容中的下一个输出(单词)的算法 – 通常用于生成文本内容
  • 生成对抗网络 (GAN):使用两个竞争神经网络产生新输出的深度学习系统,主要用于视觉或音频内容生成
  • 变分自动编码器 (VAE):对输入进行编码和解码以创建新输出的神经网络系统,通常用于生成视觉或代码内容

Gen AI 与其他类型的 AI

标准的生成式人工智能含义并不包括所有类型的人工智能。

与一代人工智能不同,所谓的“普通”人工智能会分析和合成数据,而不是生成新的输出。

以下是另外两种类型的人工智能:

  • 对话式人工智能:使用自然语言处理(NLP)技术来分析人类语言,理解用户所说或输入的内容,并提供相关响应。这种类型的人工智能在聊天机器人和人工智能助手中最常见。
  • 预测人工智能:分析历史数据以预测特定事件的结果并提出可行的步骤。这种人工智能对于需要管理风险并做出数据驱动决策的数据分析师来说很常见。

流行的新一代人工智能工具

现在我们已经介绍了全面的生成人工智能定义,让我们仔细看看一些最广泛使用的生成人工智能工具。

聊天GPT

ChatGPT 是 OpenAI 开发的人工智能聊天机器人,可对提示生成文本响应。

像这样:

chatgpt-response.png

ChatGPT 可以执行一系列任务,例如创建列表、生成代码和回答问题。

它还生成大纲和创意内容。

ChatGPT 如何运作?

它使用生成式预训练变压器(GPT)技术来对文本提示产生类似人类的响应。

OpenAI 还提供自定义 GPT,即使用个性化提示执行特定任务的 ChatGPT 版本。

例如,您可以创建自定义 GPT 来编辑书面内容以反映您的品牌声音。

进一步阅读: ChatGPT for SEO:终极指南、提示和提示

克洛德

与 ChatGPT 一样,Claude 是一个人工智能聊天机器人,可以根据提示生成文本响应。

claude-response.png

Claude 还可以分析您上传的内容(例如电子表格或 PDF)。

然后,它会根据您的提示提供摘要或回答问题。

克劳德也可以协助完成人工智能文案和内容生成等任务。

在提示中,您可以包含有关要创建的内容的格式和风格的指南。

双子座

与 ChatGPT 和 Claude 类似,Gemini(以前称为Google Bard )是另一个针对提示提供文本响应的 AI 聊天机器人。

像这样:

gemini-response.png

作为 Google 应用程序,Gemini 与许多 Google 产品集成。这样您就可以通过 Google 搜索一键验证其响应。

您还可以提示 Gemini 汇总 Google Drive 中的文件,就像虚拟助手一样。

微软副驾驶

Microsoft Copilot 是另一个人工智能聊天机器人,它会根据提示生成多媒体响应。

microsoft-copilot-response.png

除了生成文本答案之外,它还会向您显示 Bing 搜索结果中的相关图像和链接。

达尔-E

DALL-E是 OpenAI(ChatGPT 的创建者)开发的文本到图像生成 AI 工具,可根据提示生成图像。就像这个:

dall-e-image-generation.jpg

除了描述图像的内容之外,提示还可以请求样式。

您的提示越具体和详细,图像就越有可能满足您的需求。

DALL-E 使用扩散模型来分析图像并寻找组件中的模式。

然后,图像生成应用程序使用所学到的知识来拼凑自己的人工智能图像。

注意:扩散模型向可用训练数据添加随机噪声(变化)。然后,它反转该过程以恢复数据并创建新的信息组合。

中途

Midjourney 是一种文本到图像生成器,它使用扩散模型和 LLM 来创建真实的内容。

像这样:

midjourney-image.jpg

与 DALL-E 相比,Midjourney 的提示通常要复杂得多。

例如,提示通常需要包括风格和构图指南等内容才能获得最佳结果。

与许多其他生成式人工智能工具不同,Midjourney 不是一个独立的应用程序,而是一个 Discord 机器人。要使用它,您需要加入 Midjourney Discord 服务器并提示机器人。

生成式人工智能可以用来做什么?

以下是当今生成人工智能最常见的应用。

营销

生成式人工智能工具可让您快速集思广益营销活动创意以及起草博客文章和文章。

人工智能营销软件还有助于重写内容并采用一致的语气。

例如,像 Semrush 的ContentShake AI这样的工具可以在几秒钟内生成书面和视觉内容。

甚至更好?

它指导您完成从构思到出版的整个过程。

使用方法如下:

前往应用程序并从主仪表板中单击“我自己的想法”。

然后,输入您的主题并点击“开始写作”。

semrush-contentshake-ai-dashboard.png

查看建议的标题、目标关键词、字数、语气和可读性级别。

然后点击“创建文章”。

semrush-contentshake-ai-prompt.png

通读人工智能生成的文章。

点击“发布”按原样继续或“转到重新生成”重新开始。

要手动编辑和优化内容(我们建议您这样做),请单击“转到编辑器”。

semrush-contentshake-ai-results.png

使用 ContentShake AI 的预设提示来加快优化过程。

您甚至可以在聊天窗口中输入自定义提示。

semrush-contentshake-ai-edit.png

Semrush 的另一个工具是SEO 写作助手,它包含人工智能功能,可帮助您更快地编写在线营销内容。

它还检查您工作的 SEO 潜力。

前往该工具并单击工具仪表板上的“ +分析新文本”按钮。

semrush-seo-writing-assistant-dashboard.

如果您以前使用过该工具,请单击“设置新目标”下拉菜单。

set-new-goal.png

如果您是第一次使用此工具,请输入您想要定位的关键字,然后单击“获取推荐”。

semrush-seo-writing-assistant-keyword.pn

起草或概述您的内容。

然后,使用 SEO 写作助手的 AI 功能来提高您的写作水平。

选择任何短语、句子或段落,然后单击“展开”以详细说明这些部分。

semrush-seo-writing-assistant-expand.png

检查内容的准确性和风格。

然后,单击“接受”、“拒绝”或“重试”。

semrush-seo-writing-assistant-results.pn

或者,打开“ Smart Writer ”下拉菜单并选择“ Rephraser ”。

输入您的文本并选择四个优化选项之一。

然后,单击“改写”。

semrush-seo-writing-assistant-rephraser.

查看人工智能生成的想法,然后再次单击“重新表述”以生成更多想法。

使用复制按钮选择粘贴文本的位置,或单击“替换并关闭”将其插入光标所在的位置。

semrush-seo-writing-assistant-rephraser-

使用人工智能驱动的智能作家详细阐述现有内容。

至少写几句话。

然后,单击“撰写”以生成更多副本。

semrush-seo-writing-assistant-compose.pn

选择“ Ask AI ”功能来提交自定义问题或提示。

然后,点击“询问”。

semrush-seo-writing-assistant-ask-ai.png

创建内容时,请留意右上角的分数。

该分数考虑了可读性、语气、原创性和搜索引擎优化。分数越高,内容优化得越好,也越容易阅读。

广告

您可以利用人工智能广告工具为付费促销生成文案和创意。

例如,Semrush 的AI 写作助手可以让您快速撰写广告标题。

从Semrush 应用程序中心打开该应用程序,然后选择“所有工具”>“社交媒体和广告”。

然后,选择“ Facebook Headlines ”或“ Google Ads Headlines ”来生成广告标题。

或者“ Facebook Primary Text ”或“ Google Ads Description ”作为广告描述文本。

semrush-ai-writing-assistant-options.png

然后,选择语言、创造力水平和语气。

接下来,输入您的受众和产品名称详细信息,并编写简短的产品描述。

准备好后单击“生成”。

semrush-ai-writing-assistant-prompt.png

查看结果并保存您喜欢的任何标题,或者将它们直接复制并粘贴到您的广告平台中。

semrush-ai-writing-assistant-results.png

要生成完整的广告创意,请打开Semrush 的 AdCreative.ai 。

输入您的域名或登陆页面,然后单击“导入品牌”以添加品牌元素。

该应用程序会自动识别您的品牌名称、徽标和颜色。

查看它们并单击“创建品牌”按钮。

semrush-adcreative-ai-create-brand.png

注意:如果您已经设置了品牌,请单击“品牌设置”部分中的“创建品牌”,将新品牌添加到仪表板。

从资产类型列表中,选择“广告素材”。

semrush-adcreative-ai-choose-asset-selec

选择最适合广告平台的创意格式,然后点击“下一步”。

semrush-adcreative-ai-select-creative-fo

单击“生成文本”按钮即可使用 AI 创建文本。

然后单击“下一步”。

semrush-adcreative-ai-generate-text.png

输入有关您要生成的内容的一些信息。

然后单击“保存并生成”。

generate-text.png

上传背景图像,根据需要进行裁剪,然后输入项目名称(可选)。

您还可以使用应用程序的图像搜索引擎来获取背景图像。

最后,点击“生成”。

semrush-adcreative-ai-generate-ad-creati

选中您想要使用的每个人工智能生成的资产下方的框,然后点击“下载”按钮。

semrush-adcreative-ai-assets.png

您现在可以将数字资产上传到您的广告平台并设置您的广告活动。

媒体

电影、动画和游戏工作室使用生成式人工智能更有效地制作创意内容。

借助先进的人工智能工具,他们可以生成逼真的 3D 模型、头像和视频内容。

例如,大型游戏工作室可以使用 gen AI 创建更加逼真的角色或加快游戏设计工作流程。

编码

软件开发人员能够使用GitHub Copilot等生成式 AI 工具编写程序和应用程序。

好处包括用各种编程语言编写更一致的代码、更快地调试代码以及​​提高开发人员效率。

卫生保健

生成式人工智能模型为医疗行业的广泛应用提供服务。

例如,医学研究人员使用 gen AI 进行基因组测序和药物研究。而健康从业者则使用它们进行医学成像并分配准确的医疗代码。

汽车

汽车制造商使用人工智能模型来改进车辆设计并实施车载人工智能驱动的虚拟助手。

创成式设计启发了宝马 Vision Next 100 概念车中的“活力几何” ,它可以实现与驾驶员互动的变形部件。

[ss: bmw-vision-next.png]

图片来源: 宝马

在涉及人工代理之前,许多制造商还使用人工智能提供基本的客户服务。

德勤 2023 年报告预计,生成式 AI 将使汽车行业的设备可用性提高 20%,年度维护成本降低 10%。

数据综合

如果没有训练数据,生成式人工智能模型就不可能学习或改进其流程和计算。

然而,训练数据并不一定存在于每个可能的行业或用例。

为了解决这个问题,生成模型本身可以生成用于训练目的的合成数据。

它们还有效地解决了可能阻碍各行业使用生成式人工智能的挑战和道德问题。

例如,Gen AI 工具可能会为代表性不足的群体创建更大的数据集。或者生成提供更公平版本的原始数据的数据集。

生成式人工智能的优点和局限性

要为您制作的任何人工智能生成的内容设定适当的期望,您应该熟悉使用这些模型的优点和缺点。

生成式人工智能的好处

  • 根据简短提示生成几乎任何类型的数字媒体
  • 以用户定义的一致样式或格式创建不同类型的内容
  • 使任何规模的个人和团队都有能力创建大量内容
  • 允许用户在内容创建过程中节省时间和金钱
  • 在几秒钟内简化冗长的内容或扩展简短的内容

下面是一个使用 ChatGPT 来加强对惯性定律非常冗长的解释的示例提示。

chatgpt-prompt-wordy-explanation.png

尽管这些好处很引人注目,但它们并不一定意味着任何人都应该创建专门由人工智能生成的内容。

人工反馈、事实检查和手动编辑可以帮助确保更高的质量和更高的准确性。

进一步阅读: ChatGPT 的 15 个优点(+8 个缺点)

生成式人工智能工具的局限性

生成式人工智能工具的主要局限性是:

  • 可能反映出培训内容中存在的偏见或不准确之处
  • 可能无法准确引用原始来源或属性概念
  • 其技术和方法透明度不够
  • 无法独立思考或产生新想法
  • 缺乏第一手经验和个人意见

当我们要求 Notion AI 生成有关电视节目《恶搞之家》的意见时,发生了以下情况:

notion-ai-reply.png

尽管这些限制可能看起来令人畏惧,但它们不应阻止您使用生成式 AI 应用程序来提高业务效率。

然后,利用你的人类智慧来检测人工智能编写的内容偏见、道德考虑和归因问题。并根据需要调整内容。

围绕生成人工智能的担忧

尽管人工智能肯定可以用于好的方面,但它有可能引起严重的担忧。

例如,深度伪造是经过数字修改的照片或视频,使拍摄对象看起来像是另一个人。

它们可用于恶意传播虚假信息。

尽管深度换脸检测器可以越来越多地识别模拟另一个人的图像和视频,但目前还不存在缓解这些问题的万无一失的方法。

相反,必须仔细分析内容是否存在异常情况。并遵守安全协议以保护敏感信息。

由于生成模型创建的内容模拟现有的视觉、音频和文本模式,因此它们有误导的能力。

特别是,它们模仿人类语言的能力可用于社会工程。

欧盟网络安全局将其定义为:

“所有技术都旨在说服目标出于非法原因透露特定信息或执行特定行动。”

例如,Gen AI 模型可以鼓励人们披露敏感信息。或者损害个人隐私或公司的安全。

随着生成式人工智能变得更加先进,这些模型所需的基础设施可能会达到不可持续的规模。

满足计算需求并筹集必要的资金是人工智能模型开发人员持续关注的问题。

生成式人工智能的发展史

自 2022 年 11 月推出 ChatGPT(以及不久后推出的其他基础模型)以来,生成式 AI 一直成为头条新闻。

然而,这项技术早在这个日期之前就已经存在了。

我们在下表中列出了一些主要的生成式人工智能进步。

生成式人工智能简史
1947年 智能机械
在最早记录的人工智能引用之一中,艾伦·图灵在一篇研究论文中使用了“智能机器”一词。该研究探讨了机器是否能够发现理性行为。
1950年 图灵测试
图灵开发了图灵测试,该测试评估机器和人脑之间的对话以识别机器响应。
1956年 达特茅斯人工智能会议
达特茅斯人工智能夏季研究项目被认为是人工智能的诞生,汇集了人工智能专家。
1961年 ELIZA 聊天机器人
Joseph Weizenbaum 开发了 ELIZA 聊天机器人,这是一种可以与人类交谈的心理治疗程序。这也是生成人工智能的第一个例子。
20世纪80年代 RNN架构
几位研究人员改进了循环神经网络 (RNN) 架构。进一步发展这种双向人工神经网络。
1997年 LSTM 网络
Josef Hochreiter 和 Jürgen Schmidhuber 发明了长短期记忆 (LSTM) 网络,显着提高了 AI 模型的准确性。
2014年 GAN 和 VAE
GAN 和 VAE 的发展极大地推进了生成式人工智能技术的发展。
2017年 变压器型号
新开发的 Transformer 模型首次允许 gen AI 系统创建自然语言文本。
2018年 OpenAI GPT
OpenAI 发布了 GPT,这是一种可以生成类似人类的文本并与用户对话的神经网络。
2021年 OpenAI DALL-E
OpenAI 引入了 DALL-E,通过深度学习根据提示生成数字图像。
2022年 OpenAI ChatGPT,中途测试版
OpenAI 推出了 ChatGPT(也称为 GPT-3.5),这是一种基于 Transformer 的模型,仅五天内就有 100 万用户采用。
文本到图像生成器 Midjourney 同年推出测试版。

生成式人工智能对未来意味着什么?

虽然生成式人工智能的发展时间相对较长,但在短短几年内就发生了许多重大进展。

鉴于这种快速发展,我们有理由预期新一代人工智能将继续快速发展。

那么,未来的人工智能会是什么样子呢?它会对您的行业产生什么影响?

以下是一些需要监控的进展:

  • 更多地采用生成式人工智能工具:在许多行业,公司已经向领导者施压,要求其实施人工智能工具。 Qualtrics对客户体验专业人士的调查显示,75% 的人感受到在业务中使用生成式人工智能的压力。
  • 更先进的人工智能提示:采用生成式人工智能策略的公司越多,他们的提示技能可能会变得越先进。通过广泛的测试,用户可能会开发出更具体、更细致的提示来生成更高质量的内容。
  • 人工智能生成的内容量更大:随着越来越多的个人和业务流程使用人工智能工具,人工智能生成的内容量将会增加。 哈佛大学教授 Latanya Sweeney预测 90% 的在线内容创作将不再由人类完成。
  • 改进的人工智能检测:随着人工智能的发展,人工智能检测工具可能会变得更加复杂。越来越先进的工具将更好地解决网络安全、深度造假和其他日益严重的问题,这有可能使人工智能内容更加可信。

进一步阅读: 15 个必看的人工智能趋势,为您的企业赋能

使用先进的人工智能工具来改进您的内容

无论您是刚刚开始使用生成式人工智能,还是正在寻找提高人工智能技能的方法,您都需要合适的工具。

Claude、ChatGPT 和 Semrush 的 AI 驱动套件等工具是内容创建的游戏规则改变者。

不确定该选哪一个?

查看我们对5 强人工智能写作生成器的深入指南,其中我们详细介绍了市场上最佳工具的功能、优缺点以及定价。

文章什么是生成式人工智能及其工作原理?首先出现在Backlinko上。

原文: https://backlinko.com/generative-ai

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme