上一篇文章提到,一项研究发现曼德布洛特集面积的 95% 置信区间为 1.506484 ± 0.000004。得出这个结论的样本量是多少?
比例的 95% 置信区间为
因此,如果宽度为w的置信区间以比例估计值p hat 为中心,那么我们可以解
找到
现在,在文章开头的例子中,我们从正方形 [-2, 2] × [-2, 2] 中随机采样点,并计算有多少个点落在曼德布洛特集合内。正方形的面积为 16,因此p等于 1.506484 / 16。面积的置信区间宽度为 8 × 10 −6 。这意味着比例的置信区间宽度为 5 × 10 −7 ,因此n = 5.244 × 10 12 。
关于曼德布洛特区域的疑问
上述推理对于从置信区间推断样本量是正确的,但它在曼德布洛特集的具体应用值得怀疑。真的有人做过超过一万亿次迭代吗?显然没有。
据我所知,这就是上述估计的来源。它并非基于随机样本,而是基于规则的样本网格,将其视为随机样本,然后进行外推得到上述估计。结果可能正确,但并非简单的蒙特卡洛估计。我没有仔细看过页面,但我怀疑报告的置信区间太小;在外推时,误差线往往会扩大。
从置信区间推断样本大小一文最先出现在John D. Cook身上。
原文: https://www.johndcook.com/blog/2025/09/08/inferring-sample-size/