山姆·奥特曼 ||交友网站策略|| Metaculus 更新 ||战争与战争传闻‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌ ‌‌‌‌‌‌‌

转发此电子邮件？在这里订阅以了解更多信息

曼蒂奇星期一 12/4/23

山姆·奥特曼 ||交友网站策略|| Metaculus 更新 ||战争和战争谣言

12 月 5 日

在应用程序中阅读

多种选择

人们拿这张图开玩笑，显示 OpenAI 的情况有多么疯狂。这种情况可能很疯狂，但这不是这张图的教训。教训是：针对“为什么”问题设计预测市场是很困难的。

创建者首先让人们添加自己的选项。但用户并不总是检查他们的选项是否已经存在，或者添加了与其他选项仅略有不同的选项（例如“不诚实”与“操纵性”）。结果是一场混战，但我们什么也没得到。

在某个时刻，市场出清了——我不知道这是否是一种干预，或者人们只是集中在一些答案上。现在看起来像这样：

所有五个最重要的答案（除了“我们不知道”）基本上讲述了相同的故事；董事会认为萨姆正在操纵他们以除掉海伦·托纳。

好的一面是：市场已经得出了坚定的结论。坏处：它分布在多个框架中，并且图表毫无意义。创建者承诺将所有真实答案解析为真实答案，但这会激励答案创建者变得非常模糊（之前有人提出“奥特曼在他的沟通中并不始终坦诚”，董事会给出的非解释 – 它被法令取消资格）。

也许正确的方法是让创建者选择一些相互排斥的答案（包括其他），并且不允许人们添加更多答案。但如果故事偏离了创作者创造市场时的情况，这可能意味着所有活跃的可能性都集中在“其他”类别中，从而使市场变得毫无价值。要么创作者自己解决这个问题，要么是时候开辟一个新市场了。

这是对同一问题的另一种尝试：

我更喜欢这个市场的两点：第一，创作者做出了相互排斥的答案。在这里，我们更清楚地看到，每个拥有强势地位的人都是因为 Sam 试图淘汰一名董事会成员，而不是（例如）因为公司发现了 AGI 或其他东西。

其次，市场“决心为1”。我认为这意味着，如果创建者认为 Altman 的解雇 90% 是因为罢免董事会成员，但 10% 与 AGI 有关，他们可以分别为这些答案分配 90% 和 10% 的功劳，而出价最接近 90 的人% 和 10% 获利最多。

以下是其他一些（尝试的）OpenAI 相关市场：

https%3A%2F%2Fsubstack-post-media.s3.ama

我很欣赏这件事是如何从九月份开始的，显示了奥特曼的突然解雇，第一个解雇他的计划，第一个解雇他的计划的失败，然后是第二个成功的解雇他的计划。

唯一的问题是，这里的概率似乎从 10 月到 11 月底逐渐下降，而在 Manifold 网站上，很明显，在那段时间里概率是稳定的，然后在他被解雇的那天崩溃了。我认为这是嵌入中的一个错误。

路透社报道说，解雇是由于一个名为 Q* 的模型的突破而促成的，该模型学会了数学。市场似乎认为Q*存在，但并不是突破，也没有参与炒作。

尽管伊利亚·苏茨克维尔 (Ilya Sutskever) 明显对公司表示担忧（奥特曼也可能对苏茨克维尔表示担忧），但市场认为他会继续留任。

……但不继续领导超级联盟团队？我对此感到困惑；他为什么不呢？有关的：

这是“会发生什么？”的有趣组合。以及“公司索赔会发生什么？”

这是谣言。如果我发现自己负责 OpenAI，所有员工都即将离开，并且我想利用这种情况来改善 AI 安全性（安全主义者普遍认为领先的实验室越少越好），我可能会尝试这样做。但市场似乎认为他们并没有真正尝试过。有关的：

当OpenAI还是一个造福人类的非营利组织时，他们同意一旦他们接近超级智能，他们将与任何其他也接近超级智能（并愿意与他们合并）的实验室合并，这样每个人都会共同努力将超级智能整合在一起（而不是参加竞赛）。这是他们的章程，董事会（如果董事会与非营利组织的使命保持一致）必须支持。

如果真的发生这种情况，那将是相当疯狂的，但上一届董事会似乎认真对待他们不只是普通公司的地位，也许新董事会也会如此。 “到 2026 年底”采用了这个已经相当疯狂的计划，并引入了一些关于事情进展速度的更疯狂的假设。

尽管如此，我很高兴看到人们仍在思考这个问题并认真对待它。

创建者澄清说：“我将根据董事会解雇萨姆·奥尔特曼的最初决定是否引发一系列事件，最终减少/增加人工智能风险来解决这个市场问题。因此，如果 Sam 返回 OpenAI，这个市场就不会被视为不适用。”

我不知道该如何思考这个问题。（非常强烈的）悲观案例是，一切都回到了原点，除了人工智能公司已经激进地反对 EA 和安全主义者。

我能想到的（较弱的）乐观情况是，如果没有解雇 Sam，Sam 将成功夺取董事会的控制权并消除非营利元素，将 OpenAI 转变为一家不受约束、全速前进的营利性公司。相反，董事会成功地罢免了奥特曼，并重新启动了一个新董事会，其中将有一些安全主义者或至少具有社会意识的非营利人士。也许乔纳斯会选择通过将这个不错的结果与萨姆完全控制董事会的更糟糕的反事实进行比较来解决，并决定降低风险。

我认为这可能就是董事会认为他们正在做的事情，他们确实成功实现了最终目标，但巨大的公关失败掩盖了模棱两可的商业胜利。我不明白为什么董事会没有在公关方面投入更多工作，而且我仍然对整个故事感到好奇。

这场危机以三名双方都同意的董事会成员（拉里·萨默斯、布雷特·泰勒、亚当·德安吉洛）的任命而结束，他们应该组建一个新的全体董事会，稍后再选出。我无法找到适合谁将加入这个新董事会的市场。本指南适用于 2024 年 1 月 1 日加入董事会的人员。大多数预测者并不认为届时会选出新的董事会，但少数预测者可以向我们提供一些关于他们期望的成员名单的信息。

我最不确定 Adam D’Angelo 是否是一名坚定的安全主义者。他没有明确表示，也没有公开与安全主义运动有联系。但他表现出了对这些论点的高度认识，并加入了解雇奥特曼的联盟。

如果 D’Angelo 是一名安全主义者，您可以考虑如下折衷方案：D’Angelo 是一名安全主义者，他选择了另外两名安全主义者董事会成员。布雷特·泰勒（Bret Taylor）是一位追求利润的硅谷投资者，他选择了另外两名追求利润的硅谷投资者。萨默斯是一个随意的人，他可能模糊地同意非营利组织的理念，但没有强烈的意识形态观点，他选择了另外两个这样的人作为决胜局。这似乎是一个双方都同意的良好解决方案的基础。

或者它可能与此无关。也许这根本不是马基雅维利派系的决定。布雷特·泰勒 (Bret Taylor) 是与马斯克谈判的 Twitter 董事会主席；人们认为他做得很好。他可能只是“擅长董事会的普通人”。拉里·萨默斯（Larry Summers）也是一个普通人，但可能擅长董事会。亚当·德安吉洛可以可信地声称自己是最后一个董事会中最温和的人（既不是明确的奥特曼棋子，也不是明确的安全主义者），如果他们要成立一个温和派委员会，他可以在那里提供连续性。

预测者似乎倾向于第二种假设：至少我在这里没有看到任何大的安全支持者（除了埃米特，我怀疑他是否真的被考虑在内）。李飞飞是一位人工智能道德人士，但她是那种花时间攻击阵营的人，尽管他们是她天然的盟友，并且迫切希望帮助她。这些人总是为自己做得很好，我已经和她打赌了。其他大多数人都是某种类型的硅谷商人。

哦，我差点忘了：

多重爱：一个月进度报告

一个月前，Manifold 创立了一个交友网站， manifold.love 。这个想法是，你打赌谁会是一个很好的匹配，如果他们最终有第二次约会或继续保持关系，你就赚钱（玩）钱。

令我惊讶的是，这不仅没有崩溃，反而吸引了通常预测市场社区之外的人们：

这将是一种完全不公平的刻板印象，但肯定没有一个理性主义者会把自己的头发做得像图#3中的女人那样时尚。

这些人中有些人是正常人吗？看起来难以置信，但我不能排除这种可能性。而且有数百个！

人们似乎正在使用投注功能！这是詹姆斯（该网站的创始人，所以我觉得可以向 50,000 人展示他的约会资料作为示例）。

您可以看到 Austin（他的联合创始人）提议与左边的第一位女性进行匹配，并且两个人打赌他们有 16% 的机会进行第一次约会。

（我可以看到一个以条件开头的论据 – “如果你第一次约会，你就会喜欢它继续第二次” – 但该网站更喜欢这种方式，也许作为一种表达方式“如果当你们开始对话时，你们就会彼此足够喜欢，可以进行第一次约会”）。

詹姆斯拥有所有这些比赛只是因为他是创始人吗？普通人有朋友会花这么大功夫去做媒（并打赌吗？）。我的印象是，现实生活中彼此很熟的湾区理性主义社交界人士都结识了朋友，而普通人的运气就较差。我不知道这是因为他们在网站上没有朋友，还是因为他们没有填写个人资料以供媒人离开。有一些机器人和好撒玛利亚人媒人逐渐浏览随机人的个人资料并将他们相互匹配，尽管没有任何一致性。

到目前为止，所有这一切似乎都是非正式的，而且都是出于热情。市场功能几乎不起作用。一方面，它的交易量比普通的 Manifold 低得多，不值得那些追求金钱的人花时间； James + 图片中第一位女性的市场总共有 ℳ32 ℳ32，而上面引用的“为什么 Sam Altman 被解雇”市场中有 ℳ1,700,000 ℳ1,700,000。

更重要的是，内幕交易十分猖獗。如果你更仔细地观察詹姆斯+其中一位女性的市场，你会发现 YES 的 100% 股份都由持有。。。照片中的女人。

这实际上可能是 Manifold.love 的杀手级应用程序。我与一位用户交谈过，他说他们最喜欢这个网站的一点是能够低调地与其他用户调情。您购买了您+他们的几股 YES 股票。他们看到你有兴趣，要么自己购买一些 YES 股票，要么不管它，或者购买一些 NO 股票。然后，如果你们都买了“是”，你们都会继续出价，直到任何价值让您放心地向他们发送介绍消息为止。

似乎正在发挥作用。。。

……有些人已经在预测他们的第三次约会。两次约会关系达到第三次约会的先决条件是什么？

另外，我注意到这里第二个男人的概率为 71%，即使女人和男人都下注“是”。这是免费的钱吗？我认为你必须考虑到两个都想约会的人在 12 月 11 日截止日期之前安排约会的可能性。

Manifold.love 还引入了 OKCupid 风格的“兼容性问题”。他们似乎还没有涉及计算匹配百分比，AFAICT，但希望很快！

梅塔库勒斯的“多项重大进展”

Metaculus 宣布“Metaculus 平台的多项重大进展” ，特别是“新分数、新排行榜、新奖牌”。

新分数

2021 年，我写了一篇关于 Metaculus 评分规则的争议：

每个人都同意 Metaculus 的评分规则是“正确的”，这是一个技术术语，意思是它正确地激励你选择你认为正确的概率。兹维和罗斯的反对意见是，它并没有正确地激励你是否要下注，或者在下注上投入多少努力。

例如，在许多问题上，您可以做出保证为正的赌注 – 即使您的预测错误最大，您也会获得分数。如果你想最大化你的 Metaculus 分数，你就会在所有这些问题上下注。如果您想在有限的时间内最大化您的 Metaculus 积分，您甚至可能根本不进行调查就下注。花一秒钟在一千个问题上随机选择一个数字的人会比花一小时研究一个问题的真正好答案的人得到更多的分数。

（2021 年的帖子包含了一些回应和原因，表明情况可能并不像听起来那么糟糕；请参阅此处了解详细信息）

任何评分系统都不会同时具备以下两点：1. 激励您预测尽可能多的问题；2. 仅衡量您的技能，而不衡量您的空闲时间。因此，为了鱼与熊掌兼得，Metaculus 将其分数分为两个分数：

新排行榜

…看起来像这样：

新的基线准确性和同行准确性分数有不同的排行榜，人们也会因写出好的问题和评论而获得奖励。评论板基于H 指数– 最著名的是衡量科学出版物的指数。如果您至少有 1 条评论且获得 1 票赞成，则 H 指数等于 1；如果您至少有 2 条评论且获得 2 票赞成，则 H 指数等于 2，依此类推。那么 Jgalt 是否有 10.8 条评论和 10.8 票赞成？不 – 你可以在这里阅读有关分数 h 指数的内容（这几乎是你所期望的 – 他可能有 10 条评论，每条评论有 11 票赞成，而一条评论只有 10 票赞成，所以他的表现比 h 指数 10 好，但不完全在11）。

新奖牌

这正是您所期望的 – 进入排行榜（包括特定于锦标赛的排行榜）后，您将获得一枚奖牌。排名前 1% 的用户获得金牌，排名前 2% 的用户获得银牌，排名前 5% 的用户获得铜牌。

您可以在公告页面、新的评分常见问题解答和新的奖牌常见问题解答中阅读有关最近 Metaculus 更新的更多信息。

本月市场

委内瑞拉威胁要吞并（并入侵）圭亚那。以下是预测者和市场的想法：

相关：如果你想知道拜登最新的委内瑞拉协议值多少钱：

说到南美洲，自由主义者和狗转世爱好者哈维尔·米莱在阿根廷总统选举中取得了令人震惊的胜利，为深刻的经济改革奠定了基础——如果他能推动这些改革的话：

这是两个中等活跃问题之间令人惊讶的差异（顶部：Manifold；底部：Metaculus）。我看不出分辨率标准有任何区别可以解释这一点。

继续前往中东：

对于加沙人民来说，我能想到的最现实的中期结果就是像西岸那样没有定居点和路障。我不认为他们会获得独立（以色列不会在中期允许它独立）。哈马斯的统治意味着永久的封锁和间歇性的战争。但约旦河西岸已经陷入僵局，至少在某种程度上不是监狱。以色列此前承诺不在加沙建立定居点（如果维持）将使西岸式的加沙比真正的西岸更好。

听起来，实现这一目标的第一步是以色列击败哈马斯，但之后会发生什么呢？以色列的占领将导致持续的血腥抵抗；我不相信这对当地人民来说会比哈马斯更好（尽管有人可以尝试以其他方式说服我）。巴解组织、联合国或某些傀儡国家是否可以保持足够的反以色列平衡，使加沙人不会立即叛乱，但又不能太反以色列，以致以色列继续封锁或镇压该地区，使任何人都无法正常生活生活？这是产生勉强还不错的结果的一小部分机会，但这是我能想到的主要机会。

转向不那么令人沮丧的事情，以下是广受欢迎的《时代》年度人物市场：

资料来源： Polymarket

资料来源：卡尔希

第二个有点乱，但是基本一致。泰勒·斯威夫特为什么这么高？我知道她是一位非常著名的流行歌星，但过去十年她不是每年都是同样著名的流行歌星吗？

其他链接

1：上个月，我们谈到 CFTC（监管机构）拒绝了Kalshi 就其预测市场提出选举问题的请求。 Kalshi 目前正在起诉 CFTC，要求推翻其决定，称“这些合约不包含《商品交易法》禁止的非法行为，因此 CFTC 无权阻止它们”。我不得不承认我对此感到惊讶 – 我认为 Kalshi 试图与 CFTC 建立良好的关系，但这似乎相当敌对。此外，如果他们获胜，CFTC 监管预测市场的能力还剩下什么？有监管专家想参与讨论吗？

2： @AISafetyMemes 和@betafuzz 制作了不同人对人工智能导致人类灭绝的概率估计的图表。我无法确认（或无法确认）他们的一些来源，我已将其用红色表示；如果他们想告诉我我错了，可以联系我：