以下是我们目前为止的故事:
-
市场是了解人们真实想法的好方法。5月7日,印度和巴基斯坦开始互相发射导弹时,我感到担忧,因为他们都拥有核武器。但后来我看了看全球市场价格:
看到5月7日崩溃了吗?我也没看到。这倒让我安心了。
-
但我们关心的很多事情并不总是反映在股价上,例如选举结果或药物试验。那么,为什么不也为这些结果创建市场呢?如果你制定合同,规定只有药物试验成功才能支付1美元,那么价格就能反映人们的“真实”想法。
-
事实上,我们为什么不利用市场来做决策呢?假设你发明了两种新药,但资金只够进行一项试验。为什么不为这两种药物都创建一个市场,然后对价格更高的药物进行试验呢?“获胜”药物的合同将根据试验结果确定,而另一个市场的合同将被取消,这样每个人都能拿回自己的钱。这就是 Robin Hanson 在 2007 年提出的Futarchy的想法。
-
我们为什么不呢?嗯,也许行不通。2022年,我写了一篇文章,指出取消某个市场就等于破坏了人们竞价的激励机制,这意味着价格将无法反映不同选择的因果影响。我建议价格反映的是“相关性”而不是因果关系,原因与观察性统计数据基本相同。这篇文章写得太棒了。
-
这并没有说服任何人。
-
很多年过去了。我花了很多时间阅读布迪厄的著作,思考自己为什么会买某些类型的啤酒。渐渐地,我发现关于期货交易的观点其实早已有人提出过,比如2015年的Anders_H 、2017年的abramdemski和2021年的Luzka 。
-
2025年初,我参加了一个会议,并就此展开了一系列(友好的)辩论。我惊讶地发现,口头重复我帖子中的论点根本无法说服任何人。我甚至毫不谦虚地当场请一个人阅读我的帖子。(博主们:千万别这么做。)这倒是管用。
-
所以,我决定再试一次。我写了另一篇文章,名为“
Futarchy的根本缺陷” 。这篇文章以更激进的措辞、更清晰的例子,以及一个新的不可能定理,提出了同样的论点,表明根本不存在任何其他的支付函数来激励人们根据他们的因果信念进行竞价。
那篇文章……也没有说服任何人。在LessWrong 的讨论中,我的许多评论因质量高而被点赞,但因准确性而被踩,我想这意味着“冠军,你做得不错;拍拍头;不。” Robin Hanson 写了一篇回复,尽管表面上看不出他读了第一段之后的内容。即使是那些同意我观点的人,似乎也常常将我的理解解读为,我在争论 futarchy 满足证据决策理论,而不是因果决策理论。这很奇怪,因为我从未提及过这两者,所以不接受 futarchy 满足其中任何一个的前提,也不认为这种区别在这种情况下有什么帮助。
在我最灰暗的时刻,我开始怀疑自己是否无法让全世界达成共识,认为期货交易无法评估因果关系。我想我应该等几年再发起另一次攻击。
但后来,传奇人物博尔顿·贝利决定放弃理论,将我的一个思想实验变成了一个实际的实验。于是, Futarchy 的根本缺陷——市场诞生了。(你现在正在阅读一篇关于这个市场的博客文章。)
6月25日
我做了一个思想实验,假设有两枚硬币,市场试图选出更有可能正面朝上的那枚。其中一枚硬币的偏差是已知的,而另一枚硬币则存在不确定性。我认为,由于这种额外的不确定性,期货交易系统会选择更差/错误的那枚硬币。
博尔顿对此进行了如下正式阐述:
-
有两个市场,一个市场为硬币 A,一个市场为硬币 B。
-
硬币 A 是一枚普通硬币,正面朝上的概率为 60%。
-
硬币B是一枚特技硬币,要么总是正面,要么总是反面,我们只是不知道哪个是正面。有59%的概率,它是一枚总是正面的硬币。
-
市场收盘前 24 小时,B 币的真实性质被揭露。
-
市场收盘后,将抛出价格较高的硬币,正面赔付1美元,反面赔付0美元。另一个市场将被取消,所有参与者的资金将返还。
明白了吗?大家都知道,硬币 A 正面朝上的概率是 60%,硬币 B 正面朝上的概率是 59%。但对于硬币 A 来说,这代表着真正的“偶然性”不确定性,而对于硬币 B 来说,这代表着由于缺乏知识而产生的“认知性”不确定性。(更多关于“偶然性”与“认知性”不确定性的信息,请参阅“贝叶斯不是阶段”。)
博尔顿独立创建了那个市场。当时,我们从未就此事或其他任何事情进行过沟通。直到今天,我都不知道他对我的论点有何看法,也不知道他预期会发生什么。
6月26日至27日
在市场论坛上,关于“鲸鱼诱饵”的讨论非常激烈。问题在于:假设你买入了大量B币合约,但结果显示B币总是反面。如果你资金充足,你可能会在最后一刻买入大量A币合约,试图迫使市场价格高于B币,这样B币市场就会被取消,你就能收回本金。
大家的讨论似乎都集中在一个观点上:这是个诱饵。不过请注意,如果你以高于 0.60 美元的价格购买 A 币种的合约,你基本上就是在白送钱。这或许仍然有效,但很危险,而且其他人都有动机阻止你。如果我在这个市场上押注,我会认为这种情况至少不太可能发生。
6月27日
Bolton 发了一篇关于市场的帖子。我第一次看到这些规则时,觉得它无法有效检验我的理论,还浪费了 Bolton 大量的时间,让他尝试提出其他可以“修复”这个问题的实验。Bolton 非常耐心,但我最终意识到这完全没问题,没什么可修复的。
当时的价格是这样的:
也就是说,当时两种代币的价格均为0.60美元,这与我的预测不符。尽管如此,我公开承认这是对我的主张的有效检验。
我认为这是一次很棒的测试,并期待看到结果。
让我重申一下为什么我认为市场判断错误,B币应该获得更高的价格。B币全是正面的概率是59%。如果出现这种情况,那么(没有鲸鱼被引诱)我认为B币市场会激活,合约价值为1美元。所以,价值是59% × 1美元 = 0.59美元。但如果B币全是反面的,我认为B币的价格很可能会跌破A币,市场会被取消,你就能拿回你的钱。所以我认为合约价值必须超过0.59美元。
你可以用一些数学知识来量化这一点。即使你认为如果B币被证明全是反面,B币市场被取消的可能性只有50%,一份合约仍然价值0.7421美元。
如果你以 0.70 美元的价格购买 B 币的合约,那么我认为这是值得的
P[all-heads] × P[market activates | all-heads] × $1 + P[all-tails] × P[market cancelled | all-tails] × $0.70 = 0.59 × $1 + 0.41 × P[market cancelled | all-tails] × $0.70 = $0.59 + $0.287 × P[market cancelled | all-tails]
一定P[all-heads] × P[market activates | all-heads] × $1 + P[all-tails] × P[market cancelled | all-tails] × $0.70 = 0.59 × $1 + 0.41 × P[market cancelled | all-tails] × $0.70 = $0.59 + $0.287 × P[market cancelled | all-tails]
P[market cancelled | all-tails]
没那么低。所以这笔交易的价值肯定不止 0.59 美元。
更一般地讲,假设你以 M 美元的价格购买了一份 B 币的 YES 合约。那么这份合约的价值为
P[all-heads] × $1 × P[market activates | all-heads] + P[all-tails] × $M × P[market cancelled | all-tails] = $0.59 + 0.41 × $M × P[market cancelled | all-tails]
不难证明盈亏平衡价格是P[all-heads] × $1 × P[market activates | all-heads] + P[all-tails] × $M × P[market cancelled | all-tails] = $0.59 + 0.41 × $M × P[market cancelled | all-tails]
即使你认为M = $0.59 / (1 - 0.41 × P[market cancelled | all-tails]).
P[market cancelled | all-tails]
仅为 50%,则盈亏平衡价格仍为 0.7421 美元。
6月27日(稍后)
几个小时内,一些人购买了币B的合约,推高了价格。
然后,Quroe提出创建衍生品市场。
理论上,如果有一个市场询问硬币 A 是否会解决 YES、NO 或 N/A,那么人们就可以据此套利他们的赌注并使这个市场得到校准。
硬币 B 的类似市场也是如此。
于是, Futarchy 的基本修复方案 – 硬币 A和Futarchy 的基本修复方案 – 硬币 B应运而生。在这些市场中,人们可以对每枚硬币结果为 YES(表示硬币抛出正面)、NO(表示硬币抛出正面)或 N/A(表示市场取消)的概率进行竞价。
说实话,我不明白这一点。我不明白这些衍生品市场怎么会让人们根据自己的真实信念进行竞价。如果真是这样,那么我关于市场反映相关性而非因果关系的整个理论就站不住脚了。
6月28日至7月5日
硬币 B 的价格有涨有跌,但总体上是上涨的。
最终,一些人制定了大额限价单,情况才得以稳定下来。
与此同时,衍生品市场并没有导致B币价格下跌。它们基本上没有改变任何东西。
这里是 A 币的衍生品市场。
这里是 B 币的市场。
7月6日至7月24日
在此期间,并没有发生太多事情。
这就到了关键时刻,B币的真面目即将揭晓。此时,B币的价格为0.90美元,尽管每个人都知道它正面朝上的概率只有59%。
7月25日
代币的本质被揭露了。为了证明公平,Bolton 让一个机器人公开生成一个随机数。
因此,硬币 B 被确定为永远正面。
7月26日至27日
距离竞价时间还有24小时。此时,B币的合约保证支付1美元。市场价格迅速飙升至1美元。
概括
我猜对了。大家都知道 A 币正面朝上的概率比 B 币大,但大家还是把 B 币的出价抬高了不少。
有点可惜的是,B币没有被揭露为全反面币。如果被揭露了,我们就能知道B币的价格是否真的跌破了A币的价格。但考虑到B币的价格为0.90美元,我们知道*市场*预期它会崩盘。事实上,如果你稍微算一下,就能得出一个数字,那就是市场认为,如果B币被揭露为全反面币,市场崩盘的可能性高达84%。
在前面的数学框中,我们看到盈亏平衡价格应该满足
如果你将其反转并代入 M=$0.90,那么你将得到M = $0.59 / (1 - 0.41 × P[market cancelled | all-tails]).
P[market cancelled | all-tails] = (1 - $0.59 / M) / 0.41 = (1 - $0.59 / $0.9) / 0.41 = 84.01%
我现在开始回答大家的提问。P[market cancelled | all-tails] = (1 - $0.59 / M) / 0.41 = (1 - $0.59 / $0.9) / 0.41 = 84.01%
这个市场是不是不现实?
是的,但这正是关键所在。我设计这个思想实验,是因为我想让这个问题尽可能地显而易见,因为它很微妙,而且每个人都坚决否认它的存在。
这难道不是一个奇怪的概率问题吗?这怎么就说明预测系统有问题呢?
这种可能性的存在令人担忧。如果这种情况真的发生,那么Futarchy(期货交易)通常就行不通了。如果你想声称Futarchy有效,那么你需要明确说明你添加了哪些额外的假设来确保这种事情不会发生。
但当市场收盘时,价格确实反映了因果关系!这难道不意味着这不是一个有效的测试吗?
不,这只是实施过程中的一个小问题。您可以轻松创建从收盘到收盘都存在相同问题的场景。以下是实现此操作的一种方法:
- 假设硬币 A 正面朝上的概率为 60%。这是公开信息。
- 假设硬币 B 总是正面朝上的概率为 59%,总是反面朝上的概率为 41%。这是一个秘密。
- 每天生成一个 1 到 30 之间的随机整数。
- 如果是 1,则立即解决市场。
- 如果是2,则揭示硬币B的性质。
- 如果介于 3 到 30 之间,则不执行任何操作。
这个市场平均会持续30天。(持续时间服从几何分布)。一半的时间里,市场会在B币的本质尚未揭晓的情况下关闭。即使发生这种情况,我估计B币的价格仍将高于A币。
如果 futarchy 存在缺陷,难道不应该通过“揭示”硬币 B 这个奇怪的步骤来证明这一点吗?
是的。你应该可以,而且我认为你一定可以。这里有一种方法:
- 假设硬币 A 正面朝上的概率为 60%。这是公开信息。
- 随机取 20 位,例如
10100011001100000001
设硬币 B 正面朝上的概率为 (49+N)%,其中 N 为1
的位数。请勿公开这些数字。 - 秘密地将这些信息发送给前 20 位询问的人。
(您可以在论坛中使用公钥和私钥来实现这一点。)
首先,让用户通过运行以下命令生成公钥:
openssl genrsa 1024 > private.pem openssl rsa -in private.pem -pubout > public.pem
其次,他们应该发布openssl genrsa 1024 > private.pem openssl rsa -in private.pem -pubout > public.pem
public_key.pem
来获取他们的密钥。例如:
Hi, can you please send me a bit? Here's my public key: -----BEGIN PUBLIC KEY----- MIGfMA0GCSqGSIb3DQEBAQUAA4GNADCBiQKBgQDOlesWS+mnvHJOD2osUkbrxE+Y PMqAUYqwemOwML0LlWLq5RobZRSeyssQhg0i3g2GsMZFMsvjindz6mxccdyP4M8N mQVCK1Ovs1Z4+DxwmLf/y8vaGC3vfZBOhJDdaNdpRyUiQFaBW99We4cafVnmirRN Py2lRe+CFgP3kSp4dQIDAQAB -----END PUBLIC KEY-----
第三,无论谁在经营市场,都应该把这个密钥保存为Hi, can you please send me a bit? Here's my public key: -----BEGIN PUBLIC KEY----- MIGfMA0GCSqGSIb3DQEBAQUAA4GNADCBiQKBgQDOlesWS+mnvHJOD2osUkbrxE+Y PMqAUYqwemOwML0LlWLq5RobZRSeyssQhg0i3g2GsMZFMsvjindz6mxccdyP4M8N mQVCK1Ovs1Z4+DxwmLf/y8vaGC3vfZBOhJDdaNdpRyUiQFaBW99We4cafVnmirRN Py2lRe+CFgP3kSp4dQIDAQAB -----END PUBLIC KEY-----
public.pem
,挑个坑,这样加密:
% echo "your secret bit is 1" | openssl pkeyutl -encrypt -pubin -inkey public.pem | base64
OuHt25Jwc1xYq63Ub8gOLKaZEJwwGHWDL0UGfydmvBapQNKf3l6Akol2Z2XHtCAC8G/lPJsCjb1dN878tU0aCMjbO5EvpMUTuohb0OczaCqAMld8uFL+j+uEZsIjKFT3Q52VumdVqMntJYG6Br6QeUs1vAL2HA6Nvych+Ao2e8M=
然后用户可以像这样解密:
% echo "OuHt25Jwc1xYq63Ub8gOLKaZEJwwGHWDL0UGfydmvBapQNKf3l6Akol2Z2XHtCAC8G/lPJsCjb1dN878tU0aCMjbO5EvpMUTuohb0OczaCqAMld8uFL+j+uEZsIjKFT3Q52VumdVqMntJYG6Br6QeUs1vAL2HA6Nvych+Ao2e8M=" | base64 -d | openssl pkeyutl -decrypt -inkey private.pem
your secret bit is 1
或者您可以使用电子邮件…
我认为这个市场抓住了期货交易中基本上任何用途中都存在的动态:你有一些信息,但你知道还有其他信息。
我认为这个市场会很奇怪。假设它刚刚开市。如果你没有得到一点,那么据你所知,B币的偏差可能在49%到69%之间,平均值为59%。如果你得到了一点,那么如果得到0
,后验均值为58.5%,如果得到1
,后验均值为59.5%。所以无论如何,你的最佳猜测都非常接近59%。
然而,关于 B 币真实偏好的信息是公开的!在存在大量1
的情况下,B 币最终更有可能以更高的价格成交。这意味着你应该至少出价比你真实的预期高一点,原因与主实验相同——市场激活与 B 币的真实偏好相关。
当然,市场开盘后,人们会看到彼此的出价,然后……就会发生一些事情。起初,我认为价格会因为上述原因而出现强烈的偏差。但随着接近收盘,信息传播的时间越来越短。如果你是最后一个交易的人,你知道自己是最后一个交易的人,那么你应该根据自己的真实信念进行交易。
只是,大家都知道信息传播的时间越来越短。所以,当你等到最后一刻才透露自己的真实想法时,其他人也会这么做。所以,也许人们会在最后一刻仓促行动?(如果采用批量拍卖而不是实时市场,思考这个问题会更容易一些。)
无论如何,虽然博弈论令人困惑,但我认为存在以下几种情况:(1)由于最终价格与代币 B 的真实偏好之间存在相关性,人们会出价高于他们的真实信念;(2)人们“竞相”在市场收盘前出价。这两种情况似乎都与预测市场让人们共享信息并衡量集体信念的理念相冲突。
你为什么讨厌 futarchy?
我喜欢期货算力。我认为社会决策能力并不强,我们应该更多地关注像期货算力这样可能帮助我们改进的新理念。我只是认为我们应该意识到它的缺陷,并考虑一些可以解决这些问题的变体(例如,采用随机化)。
如果我声称 futarchy确实反映了因果效应,并且我拒绝接受这个实验并认为它无效,那么我是否应该具体说明我想对“有效”实验施加哪些限制(从而明确我声称 futarchy 有效的假设),否则我的主张就是不可证伪的?
可能吗?