每隔几个月，我都会撰写一篇关于如何使用人工智能的主观指南1 ，但现在我写作的时代，大约有10% 的人类每周都会使用人工智能 1 。绝大多数使用都涉及免费的人工智能工具，这通常没什么问题……除非情况并非如此。OpenAI 最近发布了一份关于人们实际使用 ChatGPT 用途的分析报告（休闲聊天远比你想象的要少，信息搜索远比你预期的要多）。这意味着我终于可以根据实际使用模式而不是直觉给你建议了。我在 OpenAI 的图表上添加了注释，并提出了一些关于何时使用免费模型和高级模型的建议。

如果图表表明免费模型足以满足您的 AI 用途，请选择您最喜欢的模型并使用它，而不必担心指南中的任何其他内容。您基本上有九种左右的选择，因为只有少数公司可以制作尖端模型。他们都提供一些免费访问权限。四个最先进的 AI 系统是 Anthropic 的Claude 、谷歌的Gemini 、OpenAI 的ChatGPT和 Elon Musk 的 xAI 的Grok 。然后是开放权重 AI 家族，它们几乎（但不完全）一样好： Deepseek 、 Kimi 、中国的Z和Qwen以及法国的Mistral 。这些 AI 模型的变体结合在一起，占据了几乎所有 AI 评级系统的前 35 个位置。您使用的任何其他提供尖端 AI 的 AI 服务，从 Microsoft Copilot到Perplexity （两者都提供一些免费使用），都由这九种 AI 中的一种或多种作为基础。

你应该如何在它们之间做出选择？一些免费系统（如 Gemini 和 Perplexity）在网页搜索方面做得很好，而其他系统则根本无法搜索网页。如果你想要免费的图像创建，最好的选择是 Gemini，ChatGPT 和 Grok 是亚军。但最终，这些人工智能在许多细微的方面有所不同，包括隐私政策、访问级别、能力、处理道德问题的方法以及“个性”。所有这些都会随着时间而波动。因此，请根据这些因素选择你喜欢的模型并使用它。但是，如果你正在考虑升级到付费帐户，我建议从 Anthropic、Google 或 OpenAI 的免费帐户开始。如果你只想使用免费模型，开放权重模型和聚合服务（如 Microsoft Copilot）有更高的使用限制。

现在来谈谈困难的事情。

选择先进的人工智能系统

如果你想认真使用高级人工智能，你需要每月支付 20 美元到 200 美元左右，具体取决于你的需求（尽管一些公司正在世界某些地区尝试其他定价模式）。20 美元的套餐适合绝大多数人，而 200 美元的套餐则适合有复杂技术和编程需求的人。

您需要在三个系统中选择一个来花费 20 美元：Anthropic 的Claude 、Google 的Gemini和 OpenAI 的ChatGPT 。通过所有选项，您可以访问高级、代理和快速模型、语音模式、查看图像和文档的能力、执行代码的能力、优秀的移动应用程序、创建图像和视频的能力（然而 Claude 在这方面有所欠缺）以及进行深度研究的能力。它们都有不同的个性和优缺点，但对于大多数人来说，只需选择自己最喜欢的一个就足够了。有些人，尤其是 X 的重度用户，可能会考虑 Elon Musk 的 xAI 的Grok ，它拥有一些最强大的 AI 模型并且正在迅速添加功能，但在产品安全方面不如其他一些公司那么透明。微软的Copilot提供了 ChatGPT 的许多功能，用户可以通过 Windows 访问，但很难控制您使用的模型以及何时使用。因此，对于大多数人来说，只需坚持使用 Gemini、Claude 或 ChatGPT。

然而，仅仅从这三个模型中选择一个是不够的，因为每个AI系统都有多个AI模型可供选择。聊天模型通常是免费的，最适合用于对话，因为它们回复速度快，而且通常最具人性化。代理模型需要更长的时间来回答问题，但可以自主执行许多步骤（搜索网页、使用代码、制作文档），完成复杂的工作。向导模型需要很长时间，并且处理非常复杂的学术任务。对于重要的实际工作，我建议使用代理模型，它们功能更强大、一致性更高，出错的可能性也更小（但请记住，所有AI模型仍然具有很大的随机性，如果你再次提出相同的问题，它们可能会以不同的方式回答。）

同样的问题是，聊天模型和代理模型分别提出的。你可以看到，聊天模型的回答是“脱口而出”，而代理模型在回答之前做了外部研究，并检验了大量假设。

选择模型

对于 ChatGPT，无论你使用免费版还是付费版，默认提供的模型都是“ChatGPT 5”。问题在于，GPT-5 并非单一模型，而是多种多样，从非常弱的 GPT-5 mini 到非常优秀的 GPT-5 Thinking，再到极其强大的 GPT-5 Pro。当你选择 GPT-5 时，你真正获得的是“自动”模式，AI 会决定使用哪个模型，通常是性能较弱的模型。付费后，你可以决定使用哪个模型，而且，更复杂的是，你还可以选择模型“思考”答案的强度。对于任何复杂的问题，我总是手动选择 GPT-5 Thinking Extended（20 美元套餐）或 GPT-5 Thinking Heavy（如果你购买的是 200 美元的型号）。对于需要大量思考的真正难题，你可以选择最强大的模型 GPT-5 Pro，但只有在最高价位才有。

对于 Gemini，你只有两个选择：Gemini 2.5 Flash 和 Gemini 2.5 Pro，但如果你购买 Ultra 套餐，则可以访问 Gemini Deep Think（位于另一个菜单中）。目前，Gemini 2.5 是主流 AI 模型中最弱的（尽管仍然相当强大，Deep Think 也非常强大），但预计新的 Gemini 3 将在未来几个月内推出。

最后，Claude 让选择模型变得相对容易。你可能想用 Sonnet 4.5 来处理所有问题，唯一的问题是你是否选择扩展思维（针对更难的问题）。目前，Claude 还没有与 GPT-5 Pro 相当的版本。

如果您正在使用其中任何模型的付费版本，并希望确保您的数据永远不会用于训练未来的人工智能，您可以轻松关闭 ChatGPT 和 Claude 的训练功能，而不会损失任何功能，但需要牺牲 Gemini 的部分功能。所有人工智能模型还附带一系列其他功能，例如项目和内存，您可以在熟悉使用它们的过程中探索这些功能。

获得更好的答案

人工智能的最大用途是实际指导和获取信息，有两种方法可以显著提高这类问题的结果质量：触发深度研究模式和/或将人工智能连接到您的数据（如果您愿意这样做）。

深度研究是一种模式，AI 会在回答之前花 10-15 分钟的时间进行广泛的网络研究。即使人们还不知道，深度研究对大多数人来说都是一项关键的 AI 功能，它很有用，因为它可以生成非常高质量的报告，这些报告常常给我交流过的信息专业人士（律师、会计师、顾问、市场研究人员）留下深刻印象。深度研究报告并非没有错误，但比仅仅向 AI 询问某些内容要准确得多，而且引用往往是正确的。还要注意，每个深度研究工具的工作方式略有不同，各有优缺点。即使没有深入研究，GPT-5 Thinking 也会自行进行大量研究，而 Claude 有一个“中等研究”选项，您可以在其中打开网络搜索但不进行研究。

如何触发深度研究模式，以及如何将您的数据连接到 Claude 和 ChatGPT

连接您自己的数据非常强大，而且从 Gmail 到 SharePoint，所有应用都越来越容易连接。我发现 Claude 尤其擅长整合电子邮件、日历、各种驱动器等的搜索功能——当您将 Claude 连接到您的帐户后，您可以让它“给我一份详细的当天简报”，您可能会觉得它非常出色。人工智能公司正在这个领域投入大量精力，相关产品也在快速发展。

多模态输入

我之前提到过，使用 AI 的一个简单方法就是从语音模式开始。目前最好的两个语音模式实现是 Gemini 应用和 ChatGPT 的应用及网站。Claude 的语音模式比其他两个系统弱一些。需要注意的是，语音模型是针对聊天进行优化的（包括所有旨在让你感觉像在与人交谈的短促停顿和呼吸），因此你无法通过这种方式访问更强大的模型。

所有型号都支持各种数据：现在可以上传 PDF、图片，甚至视频（ChatGPT 和 Gemini 除外）。App 版本，尤其是 ChatGPT 和 Gemini，一个很棒的功能是可以共享屏幕或摄像头。只需将手机对准坏掉的电器、一道数学题、你正在练习的菜谱，或者一个外语标识，AI 就能看到你看到的内容并实时响应。这让 Siri 和 Alexa 等老牌助手显得非常原始。

为您制作：图像、视频、代码和文档

Claude 和 ChatGPT 现在可以制作高质量的 PowerPoint 和 Excel 文件（目前，Claude 在这两种文档格式方面处于领先地位，但这种情况可能会在未来发生变化）。这三个系统还可以通过编写代码生成各种其他输出。为了让 Gemini 可靠地执行此操作，当您希望这些系统运行代码或生成单独的输出时，需要选择“Canvas”选项。Claude 有一个专门的工件部分，展示了一些使用代码可以实现的示例。每个模型也都提供了非常强大的专用编码工具，但这些工具过于复杂，本指南无法一一介绍。

ChatGPT 和 Gemini 也可以帮你制作图片（Claude 不行）。Gemini 拥有目前最强大的 AI 图像生成模型。Gemini 和 OpenAI 在 Veo 3.1 和 Sora 2 中也都拥有强大的视频生成能力。Sora 2 是一款真正的社交媒体应用，允许你将自己融入任何视频中，而 Veo 3.1 则更侧重于通用性。它们都能制作有声视频。

你们很多人都知道，我对任何新的AI图像或视频模型的测试都是看它能否在飞机上使用Wi-Fi拍摄水獭。这已经不再是挑战了。所以，Sora 2 把飞机上的水獭展现成一部自然纪录片……一部80年代的音乐视频……一部现代惊悚片……一部50年代的低成本科幻电影……一部安全视频，一部黑色电影……一部动漫……一部90年代的电子游戏过场动画……一部法国艺术电影。

我多年来一直在警告这一点，但正如你所见，你真的不能再相信你在网上看到的任何东西了。请对所有视频持保留态度。另外，提醒一下，四年前如果你让人工智能提供飞机上一只水獭的图像，你就会得到这样的结果。事情发展得太快了。

快速提示

除了选择模型的基础知识之外，还有一些经常出现的事情值得考虑：

幻觉：从很多方面来看，幻觉远不如以往那么令人担忧，因为新型人工智能模型能够更好地避免幻觉。然而，无论人工智能多么优秀，它仍然会犯错，并且仍然会在错误的地方给出自信满满的答案。它们还会对自己的能力和行为产生幻觉。如果答案来自高级模型，并且人工智能进行过网络搜索，那么答案的正确率就更高。记住，人工智能不知道自己“为什么”会做某事，所以要求它解释其逻辑毫无意义。但是，如果你发现问题，人工智能模型的思维轨迹可能会有所帮助。
谄媚与个性：所有人工智能聊天机器人都变得更具吸引力和讨人喜欢。一方面，这让它们使用起来更有趣，另一方面，也有可能让人工智能看起来像人，而实际上并非如此，这可能会导致人们对人工智能产生更强烈的依赖。一个相关的问题是谄媚，即人工智能会赞同你所说的话。造成这种情况的原因很复杂，但当你需要真正的反馈时，要明确地告诉人工智能要像批评家一样。否则，你可能会和一个非常老练的唯唯诺诺者交谈。
为 AI 提供上下文。虽然添加了记忆功能，但大多数 AI 模型只识别基本的用户数据和当前聊天中的信息，无法记住或了解你之外的信息。因此，你需要为 AI 提供上下文：文档、图片、PowerPoint，甚至一段关于你自己的介绍性文字都可以——你可以使用文件选项随时上传文件和图片，或者使用我们之前讨论过的连接器。
不必过于担心提示是否“好”：旧版 AI 模型要求你使用诸如思维链之类的技巧来生成提示。但随着 AI 模型的改进，这一点的重要性逐渐减弱，模型也越来越擅长理解你想要什么。在最近的一系列实验中，我们发现这些技巧已经不再真正起作用了（而且，威胁它们或善待它们似乎通常也没什么用）。
实验并享受乐趣：玩耍通常是了解人工智能能力的好方法。让视频或图像模型制作动画，让高级人工智能将你的报告或写作变成游戏，就你感兴趣的主题进行深入研究报告，让人工智能根据图片猜测你的位置，向人工智能展示你冰箱的图片并征求食谱创意，与人工智能一起规划一次梦想之旅。尝试各种方法，你就能了解系统的局限性。

进展如何

我在撰写本指南时提到，人类每周使用人工智能的人数为 10%。几个月后我撰写下一篇更新时，这个数字可能会更高，模型也会更完善，而我今天提出的一些具体建议也会过时。不变的是，那些学会使用这些系统的人会找到从中获益的方法，并为未来构建直觉。

这篇文章顶部的图表展示了人们今天使用人工智能的目的。但我敢打赌，两年后，这个图表看起来会完全不同。这不仅是因为人工智能改变了它能做的事情，还因为用户弄清楚了它应该做什么。所以，选择一个系统，从一些对你真正重要的事情开始，比如你需要写的报告、你试图解决的问题，或者你一直拖延的项目。然后尝试一些不可思议的事情，看看会发生什么。目标不是成为人工智能专家。而是建立对这些系统能做什么和不能做什么的直觉，因为随着这些工具的不断发展，这种直觉才是最重要的。

人工智能的未来不仅仅在于更好的模型，还在于人们如何利用它们。

立即订阅

这份指南仅代表我个人观点，因为就像我在 Substack、社交媒体和书籍上的所有文章一样，都是我自己撰写的，只有在草稿完成后才会收到 AI 反馈。我可能会犯错，我的观点也可能与你不同，但我没有从任何 AI 公司那里拿钱，所以这些都只是我个人的观点。

原文： https://www.oneusefulthing.org/p/an-opinionated-guide-to-using-ai