Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

Gemini 2.0 Flash“思维模式”

Posted on 2024-12-20

这些新车型的发布一直在源源不断地涌现。今天,它被 Google 活泼地命名为gemini-2.0-flash-thinking-exp ,这是他们第一个进入 o1 风格推理扩展类模型的产品。今天早上我发表了一篇关于这些重要性的精彩文章。

来自Gemini 模型文档:

Gemini 2.0 Flash 思维模式是一个实验模型,经过训练可以生成模型作为其响应的一部分所经历的“思维过程”。因此,思考模式的响应推理能力比基础 Gemini 2.0 Flash 模型更强。

我刚刚发布了llm-gemini 0.8,支持该模型。您可以使用LLM尝试一下,如下所示:

 llm install -U llm-gemini  
#如果您还没有设置 Gemini 键:  
llm 键设置双子座  
#将密钥粘贴到此处  
  
llm -m gemini-2.0-flash-thinking-exp-1219 “解决山羊生菜狼河谜题的更难变体”

这是一个非常健谈的模型– 2,277 个输出标记回答该提示。

一个更有趣的例子

到目前为止,我发现的示例提示的最佳来源是Gemini 2.0 Flash Thinking 食谱– 一个 Jupyter 笔记本,其中充满了模型功能的演示。

到目前为止我最喜欢的是这个:

What's the area of the overlapping region?

三角形与圆重叠的图

该模型是多式联运的!

以下是使用llm-gemini运行该示例的方法:

 llm -m gemini-2.0-flash-thinking-exp-1219 \  
  -a https://storage.googleapis.com/generativeai-downloads/images/geometry.png \  
  “重叠区域的面积是多少? ”

这是完整的回复,包括 MathML 的工作。最终结论:

最终答案是9π/4

这与 Google 在示例笔记本中提供的答案相同,所以我认为它是正确的。感人的!

骑自行车的鹈鹕的 SVG 怎么样?

 llm -m gemini-2.0-flash-thinking-exp-1219 \  
  “生成鹈鹕骑自行车的 SVG ”

这是完整的回复。有趣的是,它稍微破坏了答案的开头:

This thought process involves a combination of visual thinking, knowledge of SVG syntax, and iterative refinement. The key is to break down the problem into manageable parts and build up the image piece by piece. Even experienced SVG creators often go through several adjustments before arriving at the final version.00" height="250" viewBox="0 0 300 250" fill="none" xmlns="http://www.w3.org/2000/svg">
<g>
<!-- Bicycle Frame -->

在我手动修复它以添加<svg开始标记后,我得到了这个:

这辆自行车有两个轮子,但看起来更像婴儿车。鹈鹕有一个漂亮的橙色喙,但它的翅膀是三角形的,位置很奇怪。

所以也许不是艺术大师,但无论如何读一下它的思想链还是很有趣的。

标签: google 、 ai 、生成式 AI 、 llms 、 llm 、 Gemini 、 o1 、推理缩放

原文: https://simonwillison.net/2024/Dec/19/gemini-thinking-mode/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme