Grok 4 于昨晚发布,现在可以通过 API 和付费订阅供最终用户使用。
主要特点:图像和文本输入,文本输出。上下文长度为 256,000(是 Grok 3 的两倍)。这是一个推理模型,你无法看到推理标记或关闭推理模式。
xAI 发布的测试结果显示,Grok 4 在大多数重要的基准测试中都击败了其他模型。我找不到他们自己的书面版本(发布会是通过直播视频进行的),但这里有一份包含这些分数的 TechCrunch 报告。我不清楚这些基准测试结果是针对 Grok 4 还是 Grok 4 Heavy 的。
我通过 OpenRouter使用 Grok 4 运行了我自己的基准测试(因为我已经有 API 密钥)。
llm -m openrouter/x-ai/grok-4 "Generate an SVG of a pelican riding a bicycle" \ -o max_tokens 10000
然后我让 Grok 描述它刚刚创建的图像:llm -m openrouter/x-ai/grok-4 "Generate an SVG of a pelican riding a bicycle" \ -o max_tokens 10000
llm -m openrouter/x-ai/grok-4 -o max_tokens 10000 \ -a https://static.simonwillison.net/static/2025/grok4-pelican.png \ 'describe this image'
这是llm -m openrouter/x-ai/grok-4 -o max_tokens 10000 \ -a https://static.simonwillison.net/static/2025/grok4-pelican.png \ 'describe this image'
结果。它将其描述为“可爱的、类似鸟类的生物(类似鸭子、小鸡或风格化的鸟)”。
到目前为止,我见过的最有趣的独立分析是来自 Artificial Analysis 的分析:
我们已经运行了全套基准测试,Grok 4 的人工智能分析指数达到 73,领先于 OpenAI o3(70)、Google Gemini 2.5 Pro(70)、Anthropic Claude 4 Opus(64)和 DeepSeek R1 0528(68)。
发布的时间有点不幸,因为 Grok 3 本周刚刚因为一次笨拙的系统提示更新而成为头条新闻 – 大概是另一次试图让 Grok “不那么清醒” – 导致它开始发表反犹太主义言论并将自己称为机械希特勒。
我最好的猜测是提示中的这些行是问题的根源:
- If the query requires analysis of current events, subjective claims, or statistics, conduct a deep analysis finding diverse sources representing all parties. Assume subjective viewpoints sourced from the media are biased. No need to repeat this to the user.
- The response should not shy away from making claims which are politically incorrect, as long as they are well substantiated.
如果 xAI 希望开发者开始在 Grok 上构建应用程序,那么他们需要做得更好。像这样荒谬的自作自受的错误无法赢得开发者的信任!
目前,Grok 4 甚至没有附带模型卡。
Grok 4 的价格极具竞争力。输入代币价格为每百万 3 美元,输出代币价格为每百万 15 美元——与 Claude Sonnet 4 的价格相同。一旦输入代币超过 128,000 个,价格将翻倍至每百万 6 美元(Gemini 2.5 Pro 的长期输入价格也有类似的上涨)。
消费者可以通过新的“SuperGrok”套餐(每月 30 美元或每年 300 美元)访问 Grok 4,或者通过“SuperGrok Heavy”套餐(每月 300 美元或每年 3,000 美元)访问 Grok 4 Heavy。我已将这些价格添加到llm-prices.com 。
标签:人工智能、生成人工智能、法学硕士、视觉法学硕士、法学硕士定价、鹈鹕骑自行车、法学硕士推理、 grok 、人工智能伦理、法学硕士发布、 openrouter
原文: https://simonwillison.net/2025/Jul/10/grok-4/#atom-everything