Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

Mark Gurman: @wojespn湖人队

Posted on 2023-02-10

原推:@wojespn Lakers https://twitt…

Brett Winton: @NaveenGRao 我明白了(我想) 但我具体谈论的是偏好模型的大小(人择的词汇——其他人使用“奖励模型”)。 Anthropic 在扩大参数数量(至 50b)时获得了更好的结果 无法通过相对少量的 HF 数据进行平方。

Posted on 2023-02-10

原推:@NaveenGRao I get that (I thi…

Brett Winton: 关于人类反馈强化学习的问题 RL 偏好模型数据集(50k 数据点)与模型大小(50b 参数)的比率 与底层语言模型非常不同(1,500b 标记到 70b 参数) 为什么? 我是在比较苹果和橙子吗?

Posted on 2023-02-10

原推:question on reinforcement lea…

Brett Winton: @_BruceX_(RLHF 我指的是奖励/偏好模型)

Posted on 2023-02-10

原推:@_BruceX_ (by the RLHF I mean…

Brett Winton: @_BruceX_ 那为什么RLHF模型需要那么多参数呢? 在参数数量和用于训练模型的数据量之间的权衡方面,我有什么误解吗?从某种意义上说,这个比率不应该是可以概括的吗?

Posted on 2023-02-10

原推:@_BruceX_ Then why does the R…

Brett Winton: 这只是一个经济问题吗? (收集人类反馈是昂贵的) 这不会导致偏好模型过度拟合吗?

Posted on 2023-02-10

原推:Is it just a matter of econom…

Brett Winton: @NaveenGRao 试图弄清楚/了解公司将如何优化底层语言模型和强化学习调整之间的预算……

Posted on 2023-02-10

原推:@NaveenGRao Trying to figure …

Valve 等了 15 个月才修补高严重性漏洞。黑客突袭

Posted on 2023-02-10

(信用:阀门) 研究人员发现了四种游戏模式,可以成功利用一个严重…

你可能错了事情是如何改变的

Posted on 2023-02-10

去年我把这篇文章写成一篇科学期刊的论文,但要发表它需要让它变得无…

今天的眼睛糖果:Maxfield Parrish 景观

Posted on 2023-02-10

Autumn Brook ,Maxfield Parrish,船…

Daily Crunch:Atlassian 在公开测试版中提供 Jira Product Discovery

Posted on 2023-02-10

要在太平洋标准时间每天下午 3 点向您的收件箱发送 TechCr…

报道称,推特从之前被禁的账户中赚取了数百万美元

Posted on 2023-02-10

Twitter 仅从少数一些最臭名昭著的用户那里赚取了数百万美元…

一些最好的创始人是“难相处”的人

Posted on 2023-02-10

在参考检查两极分化的企业家时要寻找什么 在对初创公司 CEO 进…

一天一页的魔力

Posted on 2023-02-10

1979 年,一天一页的日历诞生了。它基本上是一本书,但用户每天…

SpaceX 首次尝试同时启动所有 33 个星际飞船引擎,结果喜忧参半

Posted on 2023-02-10

SpaceX 已经完成了星际飞船的首次全静态点火测试,即使下个月…

女性创立的 AI 初创公司看到风险投资的增长

Posted on 2023-02-10

根据 Crunchbase 的数据,在过去几年中,对至少有一名女…

Lyft 股价因第一季度业绩指引疲弱而下跌

Posted on 2023-02-10

Lyft 在第四季度的收入表现出色,但这不足以安抚投资者对这家叫…

SpaceX 不希望乌克兰使用 Starlink 控制军用无人机

Posted on 2023-02-10

Elon Musk 的 SpaceX 可能愿意为乌克兰提供 St…

我最有价值的季节

Posted on 2023-02-10

上个月,我应邀去白宫附近的欢乐时光,所以我收拾好东西后,大约 5…

简单的个人信息选择退出

Posted on 2023-02-10

如果您希望公司停止出售您的个人信息,请安装来自消费者报告的名为P…

文章分页

上一页 1 … 1,746 1,747 1,748 … 4,427 下一页
本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Anil Dash
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Big Technology
  • Bits about Money
  • Brandon Skerritt
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • HeardThat Blog
  • Henrique Dias
  • Herman Martinus
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Li Haoyi
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Maggie Appleton
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steph Ango
  • Stephen Wolfram
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme