每隔几个月,我都会撰写一篇关于如何使用人工智能的主观指南1 ,但现在我写作的时代,大约有10% 的人类每周都会使用人工智能 1 。绝大多数使用都涉及免费的人工智能工具,这通常没什么问题……除非情况并非如此。OpenAI 最近发布了一份关于人们实际使用 ChatGPT 用途的分析报告(休闲聊天远比你想象的要少,信息搜索远比你预期的要多)。这意味着我终于可以根据实际使用模式而不是直觉给你建议了。我在 OpenAI 的图表上添加了注释,并提出了一些关于何时使用免费模型和高级模型的建议。
如果图表表明免费模型足以满足您的 AI 用途,请选择您最喜欢的模型并使用它,而不必担心指南中的任何其他内容。您基本上有九种左右的选择,因为只有少数公司可以制作尖端模型。他们都提供一些免费访问权限。四个最先进的 AI 系统是 Anthropic 的Claude 、谷歌的Gemini 、OpenAI 的ChatGPT和 Elon Musk 的 xAI 的Grok 。然后是开放权重 AI 家族,它们几乎(但不完全)一样好: Deepseek 、 Kimi 、中国的Z和Qwen以及法国的Mistral 。这些 AI 模型的变体结合在一起,占据了几乎所有 AI 评级系统的前 35 个位置。您使用的任何其他提供尖端 AI 的 AI 服务,从 Microsoft Copilot到Perplexity (两者都提供一些免费使用),都由这九种 AI 中的一种或多种作为基础。
你应该如何在它们之间做出选择?一些免费系统(如 Gemini 和 Perplexity)在网页搜索方面做得很好,而其他系统则根本无法搜索网页。如果你想要免费的图像创建,最好的选择是 Gemini,ChatGPT 和 Grok 是亚军。但最终,这些人工智能在许多细微的方面有所不同,包括隐私政策、访问级别、能力、处理道德问题的方法以及“个性”。所有这些都会随着时间而波动。因此,请根据这些因素选择你喜欢的模型并使用它。但是,如果你正在考虑升级到付费帐户,我建议从 Anthropic、Google 或 OpenAI 的免费帐户开始。如果你只想使用免费模型,开放权重模型和聚合服务(如 Microsoft Copilot)有更高的使用限制。
现在来谈谈困难的事情。
选择先进的人工智能系统
如果你想认真使用高级人工智能,你需要每月支付 20 美元到 200 美元左右,具体取决于你的需求(尽管一些公司正在世界某些地区尝试其他定价模式)。20 美元的套餐适合绝大多数人,而 200 美元的套餐则适合有复杂技术和编程需求的人。
您需要在三个系统中选择一个来花费 20 美元:Anthropic 的Claude 、Google 的Gemini和 OpenAI 的ChatGPT 。通过所有选项,您可以访问高级、代理和快速模型、语音模式、查看图像和文档的能力、执行代码的能力、优秀的移动应用程序、创建图像和视频的能力(然而 Claude 在这方面有所欠缺)以及进行深度研究的能力。它们都有不同的个性和优缺点,但对于大多数人来说,只需选择自己最喜欢的一个就足够了。有些人,尤其是 X 的重度用户,可能会考虑 Elon Musk 的 xAI 的Grok ,它拥有一些最强大的 AI 模型并且正在迅速添加功能,但在产品安全方面不如其他一些公司那么透明。微软的Copilot提供了 ChatGPT 的许多功能,用户可以通过 Windows 访问,但很难控制您使用的模型以及何时使用。因此,对于大多数人来说,只需坚持使用 Gemini、Claude 或 ChatGPT。
然而,仅仅从这三个模型中选择一个是不够的,因为每个AI系统都有多个AI模型可供选择。聊天模型通常是免费的,最适合用于对话,因为它们回复速度快,而且通常最具人性化。代理模型需要更长的时间来回答问题,但可以自主执行许多步骤(搜索网页、使用代码、制作文档),完成复杂的工作。向导模型需要很长时间,并且处理非常复杂的学术任务。对于重要的实际工作,我建议使用代理模型,它们功能更强大、一致性更高,出错的可能性也更小(但请记住,所有AI模型仍然具有很大的随机性,如果你再次提出相同的问题,它们可能会以不同的方式回答。)
选择模型
对于 ChatGPT,无论你使用免费版还是付费版,默认提供的模型都是“ChatGPT 5”。问题在于,GPT-5 并非单一模型,而是多种多样,从非常弱的 GPT-5 mini 到非常优秀的 GPT-5 Thinking,再到极其强大的 GPT-5 Pro。当你选择 GPT-5 时,你真正获得的是“自动”模式,AI 会决定使用哪个模型,通常是性能较弱的模型。付费后,你可以决定使用哪个模型,而且,更复杂的是,你还可以选择模型“思考”答案的强度。对于任何复杂的问题,我总是手动选择 GPT-5 Thinking Extended(20 美元套餐)或 GPT-5 Thinking Heavy(如果你购买的是 200 美元的型号)。对于需要大量思考的真正难题,你可以选择最强大的模型 GPT-5 Pro,但只有在最高价位才有。
对于 Gemini,你只有两个选择:Gemini 2.5 Flash 和 Gemini 2.5 Pro,但如果你购买 Ultra 套餐,则可以访问 Gemini Deep Think(位于另一个菜单中)。目前,Gemini 2.5 是主流 AI 模型中最弱的(尽管仍然相当强大,Deep Think 也非常强大),但预计新的 Gemini 3 将在未来几个月内推出。
最后,Claude 让选择模型变得相对容易。你可能想用 Sonnet 4.5 来处理所有问题,唯一的问题是你是否选择扩展思维(针对更难的问题)。目前,Claude 还没有与 GPT-5 Pro 相当的版本。
如果您正在使用其中任何模型的付费版本,并希望确保您的数据永远不会用于训练未来的人工智能,您可以轻松关闭 ChatGPT 和 Claude 的训练功能,而不会损失任何功能,但需要牺牲 Gemini 的部分功能。所有人工智能模型还附带一系列其他功能,例如项目和内存,您可以在熟悉使用它们的过程中探索这些功能。
获得更好的答案
人工智能的最大用途是实际指导和获取信息,有两种方法可以显著提高这类问题的结果质量:触发深度研究模式和/或将人工智能连接到您的数据(如果您愿意这样做)。
深度研究是一种模式,AI 会在回答之前花 10-15 分钟的时间进行广泛的网络研究。即使人们还不知道,深度研究对大多数人来说都是一项关键的 AI 功能,它很有用,因为它可以生成非常高质量的报告,这些报告常常给我交流过的信息专业人士(律师、会计师、顾问、市场研究人员)留下深刻印象。深度研究报告并非没有错误,但比仅仅向 AI 询问某些内容要准确得多,而且引用往往是正确的。还要注意,每个深度研究工具的工作方式略有不同,各有优缺点。即使没有深入研究,GPT-5 Thinking 也会自行进行大量研究,而 Claude 有一个“中等研究”选项,您可以在其中打开网络搜索但不进行研究。
连接您自己的数据非常强大,而且从 Gmail 到 SharePoint,所有应用都越来越容易连接。我发现 Claude 尤其擅长整合电子邮件、日历、各种驱动器等的搜索功能——当您将 Claude 连接到您的帐户后,您可以让它“给我一份详细的当天简报”,您可能会觉得它非常出色。人工智能公司正在这个领域投入大量精力,相关产品也在快速发展。
多模态输入
我之前提到过,使用 AI 的一个简单方法就是从语音模式开始。目前最好的两个语音模式实现是 Gemini 应用和 ChatGPT 的应用及网站。Claude 的语音模式比其他两个系统弱一些。需要注意的是,语音模型是针对聊天进行优化的(包括所有旨在让你感觉像在与人交谈的短促停顿和呼吸),因此你无法通过这种方式访问更强大的模型。
所有型号都支持各种数据:现在可以上传 PDF、图片,甚至视频(ChatGPT 和 Gemini 除外)。App 版本,尤其是 ChatGPT 和 Gemini,一个很棒的功能是可以共享屏幕或摄像头。只需将手机对准坏掉的电器、一道数学题、你正在练习的菜谱,或者一个外语标识,AI 就能看到你看到的内容并实时响应。这让 Siri 和 Alexa 等老牌助手显得非常原始。
为您制作:图像、视频、代码和文档
Claude 和 ChatGPT 现在可以制作高质量的 PowerPoint 和 Excel 文件(目前,Claude 在这两种文档格式方面处于领先地位,但这种情况可能会在未来发生变化)。这三个系统还可以通过编写代码生成各种其他输出。为了让 Gemini 可靠地执行此操作,当您希望这些系统运行代码或生成单独的输出时,需要选择“Canvas”选项。Claude 有一个专门的工件部分,展示了一些使用代码可以实现的示例。每个模型也都提供了非常强大的专用编码工具,但这些工具过于复杂,本指南无法一一介绍。
ChatGPT 和 Gemini 也可以帮你制作图片(Claude 不行)。Gemini 拥有目前最强大的 AI 图像生成模型。Gemini 和 OpenAI 在 Veo 3.1 和 Sora 2 中也都拥有强大的视频生成能力。Sora 2 是一款真正的社交媒体应用,允许你将自己融入任何视频中,而 Veo 3.1 则更侧重于通用性。它们都能制作有声视频。
你们很多人都知道,我对任何新的AI图像或视频模型的测试都是看它能否在飞机上使用Wi-Fi拍摄水獭。这已经不再是挑战了。所以,Sora 2 把飞机上的水獭展现成一部自然纪录片……一部80年代的音乐视频……一部现代惊悚片……一部50年代的低成本科幻电影……一部安全视频,一部黑色电影……一部动漫……一部90年代的电子游戏过场动画……一部法国艺术电影。
我多年来一直在警告这一点,但正如你所见,你真的不能再相信你在网上看到的任何东西了。请对所有视频持保留态度。另外,提醒一下,四年前如果你让人工智能提供飞机上一只水獭的图像,你就会得到这样的结果。事情发展得太快了。
快速提示
除了选择模型的基础知识之外,还有一些经常出现的事情值得考虑:
-
幻觉:从很多方面来看,幻觉远不如以往那么令人担忧,因为新型人工智能模型能够更好地避免幻觉。然而,无论人工智能多么优秀,它仍然会犯错,并且仍然会在错误的地方给出自信满满的答案。它们还会对自己的能力和行为产生幻觉。如果答案来自高级模型,并且人工智能进行过网络搜索,那么答案的正确率就更高。记住,人工智能不知道自己“为什么”会做某事,所以要求它解释其逻辑毫无意义。但是,如果你发现问题,人工智能模型的思维轨迹可能会有所帮助。
-
谄媚与个性:所有人工智能聊天机器人都变得更具吸引力和讨人喜欢。一方面,这让它们使用起来更有趣,另一方面,也有可能让人工智能看起来像人,而实际上并非如此,这可能会导致人们对人工智能产生更强烈的依赖。一个相关的问题是谄媚,即人工智能会赞同你所说的话。造成这种情况的原因很复杂,但当你需要真正的反馈时,要明确地告诉人工智能要像批评家一样。否则,你可能会和一个非常老练的唯唯诺诺者交谈。
-
为 AI 提供上下文。虽然添加了记忆功能,但大多数 AI 模型只识别基本的用户数据和当前聊天中的信息,无法记住或了解你之外的信息。因此,你需要为 AI 提供上下文:文档、图片、PowerPoint,甚至一段关于你自己的介绍性文字都可以——你可以使用文件选项随时上传文件和图片,或者使用我们之前讨论过的连接器。
-
不必过于担心提示是否“好”:旧版 AI 模型要求你使用诸如思维链之类的技巧来生成提示。但随着 AI 模型的改进,这一点的重要性逐渐减弱,模型也越来越擅长理解你想要什么。在最近的一系列实验中,我们发现这些技巧已经不再真正起作用了(而且,威胁它们或善待它们似乎通常也没什么用)。
-
实验并享受乐趣:玩耍通常是了解人工智能能力的好方法。让视频或图像模型制作动画,让高级人工智能将你的报告或写作变成游戏,就你感兴趣的主题进行深入研究报告,让人工智能根据图片猜测你的位置,向人工智能展示你冰箱的图片并征求食谱创意,与人工智能一起规划一次梦想之旅。尝试各种方法,你就能了解系统的局限性。
进展如何
我在撰写本指南时提到,人类每周使用人工智能的人数为 10%。几个月后我撰写下一篇更新时,这个数字可能会更高,模型也会更完善,而我今天提出的一些具体建议也会过时。不变的是,那些学会使用这些系统的人会找到从中获益的方法,并为未来构建直觉。
这篇文章顶部的图表展示了人们今天使用人工智能的目的。但我敢打赌,两年后,这个图表看起来会完全不同。这不仅是因为人工智能改变了它能做的事情,还因为用户弄清楚了它应该做什么。所以,选择一个系统,从一些对你真正重要的事情开始,比如你需要写的报告、你试图解决的问题,或者你一直拖延的项目。然后尝试一些不可思议的事情,看看会发生什么。目标不是成为人工智能专家。而是建立对这些系统能做什么和不能做什么的直觉,因为随着这些工具的不断发展,这种直觉才是最重要的。
人工智能的未来不仅仅在于更好的模型,还在于人们如何利用它们。
这份指南仅代表我个人观点,因为就像我在 Substack、社交媒体和书籍上的所有文章一样,都是我自己撰写的,只有在草稿完成后才会收到 AI 反馈。我可能会犯错,我的观点也可能与你不同,但我没有从任何 AI 公司那里拿钱,所以这些都只是我个人的观点。
原文: https://www.oneusefulthing.org/p/an-opinionated-guide-to-using-ai