中国 Moonshot AI 推出了一款未获得 MIT 授权的新型模型,这是其7 月份发布的备受好评的 Kimi-K2 模型的后续产品。
这是一个渐进式的改进——我在网上看到有人把它称为“Kimi K-2.1”。它在一系列流行的编码基准测试中得分略高,这体现了 Moonshot 的说法,即它“在公共基准测试和实际编码代理任务中表现出显著的性能提升”。
更重要的是,上下文窗口大小已从 128,000 个标记增加到 256,000 个标记。
与其前身一样,这是一个大型模型 – 混合专家配置中有 1 万亿个参数,每个令牌有 384 位专家、320 亿个激活参数和 8 位选定专家。
我使用Groq 的游乐场工具尝试“生成一只骑自行车的鹈鹕的 SVG”,并得到了这个结果,速度非常快,每秒 445 个令牌,总共花费不到 2 秒:
标签:人工智能、生成人工智能、法学硕士、 groq 、鹈鹕骑行、法学硕士发布、人工智能在中国、登月计划
原文: https://simonwillison.net/2025/Sep/6/kimi-k2-instruct-0905/#atom-everything