Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

LLM 0.13:带注释的发行说明

Posted on 2024-01-27

我刚刚发布了LLM 0.13 ,这是我的 LLM 命令行工具的最新版本,用于处理大型语言模型 – 既可以通过 API,也可以使用插件在本地运行模型。

以下是新版本的带注释的发行说明。

  • 添加了对新 OpenAI 嵌入模型的支持: 3-small和3-large以及具有不同尺寸大小的三个变体3-small-512 、 3-large-256和3-large-1024 。有关详细信息,请参阅OpenAI 嵌入模型。第394章

发布新版本的最初灵感是 OpenAI 昨天宣布的新模型:新的嵌入模型和 API 更新。

我在《嵌入:它们是什么以及它们为何重要》中编写了嵌入指南。直到最近,唯一可用的 OpenAI 嵌入模型是ada-002 – 于 2022 年 12 月发布,现在感觉有点过时了。

新的3-small型号与 ada-002 类似,但价格便宜得多(价格是 ada-002 的五分之一),并且基准分数更高。

3-large具有更高的基准,但也产生更大的向量。 ada-002和3-small产生 1536 维向量, 3-large产生 3072 维!

每个维度对应于嵌入一段内容时生成的数字数组中的一个浮点数。数字越多,这些向量所需的存储空间就越大,对它们进行余弦相似度计算所需的时间就越长。

不过,事情变得非常有趣的地方是:由于人们通常希望用质量来换取更小的向量大小,OpenAI 现在支持一种让模型返回更小的向量的方法。

LLM 还没有将选项传递给嵌入模型的机制(与可以采用-o setting value选项的语言模型不同),但我仍然希望提供新的较小尺寸。

这就是为什么我包含3-small-512 、 3-large-256和3-large-1024 :这些是硬编码到指定向量大小的核心模型的变体。

将来我希望支持嵌入模型的选项,但这是一个有用的权宜之计。

  • 默认的gpt-4-turbo模型别名现在指向gpt-4-turbo-preview ,它使用最新的 OpenAI GPT-4 Turbo 模型(当前为gpt-4-0125-preview )。第396章

昨天还宣布 – gpt-4-0125-preview是 GPT-4 模型的最新版本,根据 OpenAI 的说法,“比之前的预览模型更彻底地完成代码生成等任务,旨在减少“懒惰”的情况模型没有完成任务的地方”。

这在技术上是一个重大变化 – gpt-4-turbo LLM 别名过去指向旧模型,但现在指向 OpenAI 的gpt-4-turbo-preview别名,而后者又指向最新模型。

  • 新的 OpenAI 模型别名gpt-4-1106-preview和gpt-4-0125-preview 。

这些别名允许您显式调用这些模型:

 llm -m gpt-4-0125-preview '编写大量代码而不偷懒'
  • OpenAI 模型现在支持-o json_object 1选项,这将导致其输出作为有效的 JSON 对象返回。第373章

这是一个有趣的功能,它使用 OpenAI 选项,声称可以保证有效的 JSON 输出。

奇怪的是,使用此功能时,您必须在提示中包含单词“json”,否则 OpenAI 将返回错误!

 llm -m gpt-4-turbo \  
  ' JSON 格式的宠物鹈鹕的 3 个名称和简短简介' \  
  -o json_object 1

刚才为我返回了以下内容:

 {  
  “鹈鹕” :[  
    {  
      “姓名” : “格斯” ,  
      “简介” : “格斯是一只充满好奇心的年轻鹈鹕,对冒险有着永不满足的渴望。他因顽皮地抢夺太阳镜而在码头工人中出名。格斯整天都在探索码头,特别喜欢表演空中特技来获得美食。 ”  
    },  
    {  
      “姓名” : “苏菲” ,  
      "bio" : "索菲是一只优雅的鹈鹕,举止温柔。她在海滩上已经成为当地的名人,经常看到她精心整理羽毛或耐心地摆姿势给游客拍照。索菲有一个特别喜欢观赏的地方每天傍晚的日落。 ”  
    },  
    {  
      “名字” : “比基船长” ,  
      "bio" : " Beaky 船长是海湾的非官方监督者,性格严肃但又可爱。作为一位经验丰富的沿海天空老手,他喜欢带领他的羊群进行钓鱼探险,并且总是第一个发现归来的渔船到港口。他受到鹈鹕同伴和渔民的尊敬。 ”  
    }  
  ]  
}

它使用的 JSON 模式完全是虚构的。您可以使用示例模式来提示它,它可能会坚持使用它。

  • 自上次发布以来的新插件包括llm-mistral 、 llm-gemini 、 llm-ollama和llm-bedrock-meta 。

前两个是我写的,但llm-ollama是由Sergey Alexandrov编写的, llm-bedrock-meta是由Fabian Labat编写的。我的插件编写教程开始得到回报了!

  • 用于存储 API 密钥的keys.json文件现已创建,具有600文件权限。第351章

克里斯托弗·贝尔 (Christopher Bare) 提出了一个巧妙的建议。

  • 记录了使用 Homebrew 版本的 LLM 安装依赖于 PyTorch 的插件的模式,尽管 Homebrew 使用 Python 3.12,而 PyTorch 尚未发布该 Python 版本的稳定包。第397章

LLM 是为 Homebrew打包的。 Homebrew 软件包不久前升级到了 Python 3.12,这导致了令人惊讶的问题,因为事实证明PyTorch (某些 LLM 插件的依赖项)还没有针对 3.12 的稳定构建。

Christian Bush 在 LLM 问题线程中分享了一种解决方法,我现在已将其添加到文档中。

  • 底层 OpenAI Python 库已升级至>1.0 。这可能会导致也依赖于该库的 LLM 插件的兼容性问题。第325章

这是大部分工作。 OpenAI几个月前发布了他们的 1.0 Python 库,与之前的版本相比,它有大量的重大更改。

当时,我将 LLM 固定到以前的版本以弥补中断,但这意味着您无法在与其他需要更新 OpenAI 版本的库相同的环境中安装 LLM。

发生了很多变化!您可以在我捆绑了工作的拉取请求中找到升级的详细说明。

  • 箭头键现在可以在llm chat命令中使用。第376章

这样做的秘诀很奇怪:

导入阅读线  
阅读线。 parse_and_bind ( " \\ e[D: 向后字符" )  
阅读线。 parse_and_bind ( “ \\ e[C:forward-char” )

我在 Mastodon 上询问是否有人知道一个不那么晦涩的解决方案,但看起来这可能是我们能做的最好的了!

  • LLM_OPENAI_SHOW_RESPONSES=1环境变量现在输出有关对 OpenAI(和 OpenAI 兼容)API 进行的 HTTP 请求和响应的更详细信息。第404章

此功能在 OpenAI >1.0 升级之前通过利用某些requests内部结构来发挥作用。 OpenAI 放弃了对httpx requests ,因此我不得不从头开始重建此功能。

我最终得到了一个 TIL:使用 HTTPX 记录 OpenAI API 请求和响应。

  • 放弃了对 Python 3.7 的支持。

我不想再看到pkg_resources 相关的警告,这意味着切换到 Python 3.8 的importlib.medata 。 Python 3.7早在 2023 年 6 月就停止了支持,所以我认为这是一个不错的改变。

原文: https://simonwillison.net/2024/Jan/26/llm/#atom-everything

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • Elad Gil
  • Ellie Huxtable
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mostly metrics
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme