原推:@Magic_Catledge @a16z Thanks …
Steph Smith: 如果你需要更有说服力… 在这里观看完整剧集⬇️ youtu.be/2cMZjG518eM
原推:And if you need any more conv…
Steph Smith: @omooretweets @a16z 你绝对*粉碎*这一集。迄今为止我的最爱之一! ?
原推:@omooretweets @a16z You absol…
Steph Smith: @Yoroomie @omooretweets @a16z ?
原推:@Yoroomie @omooretweets @a16z…
GeekWire: 赞助:屡获殊荣的锡布鲁克镇位于华盛顿海岸的海滨,是远程工作的理想目的地 #GWSponsor 阅读更多:ow.ly/Cs4S50MOzmQ
原推:Sponsored: Located Oceanfront…
GeekWire: 华盛顿州立法者试图禁止初创公司 geekwire.com/2023/washingto 出售的家用强奸检测试剂盒……
原推:Washington state lawmakers se…
Elon Musk: 埃隆·马斯克转发推文: Booster 7 twitter.com/i/broadcasts/1 上的 33 个 Raptor 引擎的首次静态点火尝试…
原推: Elon Musk retweeted: First s…
Elon Musk: 总有一天,星际飞船会带我们去火星 https://t.co/oMrnBIiBjY 引用来自@SpaceX 的推文: Booster 7 静态点火测试的无人机视图 https://t.co/KN4sk1nohf
原推:One day, Starship will take u…
Elon Musk: 埃隆·马斯克转发推文: 33 Raptor 发动机静态点火尝试即将到来
原推: Elon Musk retweeted: 33 Rapt…
Elon Musk: @CatherinScience 我必须承认天生乐观(否则不会存在 SpaceX 和 Tesla),但我认为 5 年是可能的,10 年的可能性很大
原推:@CatherinScience I must admit…
Mark Gurman: @wojespn湖人队
原推:@wojespn Lakers https://twitt…
Brett Winton: @NaveenGRao 我明白了(我想) 但我具体谈论的是偏好模型的大小(人择的词汇——其他人使用“奖励模型”)。 Anthropic 在扩大参数数量(至 50b)时获得了更好的结果 无法通过相对少量的 HF 数据进行平方。
原推:@NaveenGRao I get that (I thi…
Brett Winton: 关于人类反馈强化学习的问题 RL 偏好模型数据集(50k 数据点)与模型大小(50b 参数)的比率 与底层语言模型非常不同(1,500b 标记到 70b 参数) 为什么? 我是在比较苹果和橙子吗?
原推:question on reinforcement lea…
Brett Winton: @_BruceX_(RLHF 我指的是奖励/偏好模型)
原推:@_BruceX_ (by the RLHF I mean…
Brett Winton: @_BruceX_ 那为什么RLHF模型需要那么多参数呢? 在参数数量和用于训练模型的数据量之间的权衡方面,我有什么误解吗?从某种意义上说,这个比率不应该是可以概括的吗?
原推:@_BruceX_ Then why does the R…
Brett Winton: 这只是一个经济问题吗? (收集人类反馈是昂贵的) 这不会导致偏好模型过度拟合吗?
原推:Is it just a matter of econom…
Brett Winton: @NaveenGRao 试图弄清楚/了解公司将如何优化底层语言模型和强化学习调整之间的预算……
原推:@NaveenGRao Trying to figure …