标准化测试是光荣的,但许多标准化测试却很糟糕。 最糟糕的考试几乎肯定是研究生入学考试(GRE)。 大约 9% 的考生在考试的数学部分获得 170 分的满分。 169 分使您处于第 87 个百分位,而到 166 分您就已经脱离了前四分之一。大多数参加考试的 STEM 专业的学生在中学时就完成了相关课程,因此对于强调数学的领域,分数稍低主要不是因为不理解,而是因为粗心。 当你记得只有顶级项目才是高度选择性的时,这尤其荒谬。因此,当重点标准化考试将所有顶尖学生聚集在一起时,考试的价值几乎为零。至少在 STEM 领域,GRE 的目的不再是确定哪些明星值得进入顶尖项目。重点是淘汰那些明显不合格的人。所以最终的剪辑几乎必须是怪诞的“整体”。 相比之下,常规 SAT 数学要好得多。 大约 1% 的人获得满分——大约是 GRE 数学获得满分的比例的十分之一。但从绝对值来看,SAT 仍然很糟糕。至少对于 STEM 学生来说,问题很简单,因此分数稍低主要是因为粗心而不是不理解。由于大约有 200 万学生参加 SAT 考试,大约有 20,000 名学生拥有完美的数学成绩—— 足以填补常春藤盟校的所有名额。 一流的标准化考试是什么样的?如果您决心找到最好的人,您会使用哪种测试?首先也是最重要的一点:完美的分数应该是非常罕见的。您应该能够清楚地区分 99% 与 99.9%、99.99% 等,而不是将最佳候选者聚集在一起。 在所有著名的标准化考试中,医学院入学考试(MCAT)最能满足这些条件。奇怪的是,满分是 528 分。在某一年中获得 528 分的比例约为 0.02% 。即使分数为 522,您也可以超过 99.5 个百分位数。这是完整的分布: 要了解 MCAT 相对于 GRE 数学的优越性,请考虑以下因素:GRE 数学 800 分中的 800 分与528 分中的516 分处于相同的百分位数 在 MCAT 上。想象一下,将所有分数在 516 到 528 之间的医学院申请者纳入其中,然后将他们归为一个类别。 GRE数学就是这么糟糕。 然而,经过进一步反思,即使是 MCAT 也需要进行重大改进。要进入任何医学院,您通常需要在考试中取得前三分之一的成绩。因此,几乎没有必要区分糟糕的申请者和一般的申请者。当您的目标是找到最好的测试时,理想的测试要求非常高,以至于您得到的一大堆分数不是分布的顶部,而是底部。 至少存在一种这样的标准化测试: 普特南竞赛。正如您所期望的,这是对数学能力的测试。称该测试“困难”是一种严重的轻描淡写:2025 年, 中位分数为2 分(满分 120 分) 。创历史新高!多年来,大约 4000 名经过严格筛选的考生的中位数分数恰好为 0。在分布的另一端,只有五个满分。这是 Grok 对典型年份直方图的尝试:
为什么顶尖项目不改用像 Putnam 那样的测试,或者至少是 MCAT? 觉醒是显而易见的答案。反功德战争中有很多防线。首先是完全废除标准化测试。第二是“测试可选”。但如果这些方法过于公然腐败,还有第三种选择。这是一种隐秘的方式,假装申请人比实际情况更加平等。 只需使用糟糕的顶部编码测试即可。 但公平地说,早在 90 年代,即觉醒爆发前的二十年,GRE 数学就已经很糟糕了。因此,很多问题都只是羊群效应:如果其他所有顶级工程项目都使用 GRE,那么即使替代测试是一种更优越的选择机制,要求不同的测试也太奇怪了。 解决方案(如果存在)必须来自高层。如果麻省理工学院改用普特南式的入学考试,世界顶尖的 STEM 学生将不会犹豫。如果书呆子教授们曾经有过重新确立我们对招生的控制权的好时机,那么现在就是时候了。谁和我在一起? PS 只需参加 AP 微观经济学和 AP 宏观经济学考试,就可以大大提高研究生经济学课程的入学率。它们都是有缺陷的测试,但如果你在两项测试中都不能得到 5 分,那么你还没有准备好进入研究生院。事实上,如果课程要求所有学科相关的 AP 成绩都达到 5 分,那么研究生入学率可能会全面大幅提高。想要成为历史学家的人应该在美国、欧洲和世界历史上取得 5 分才能申请,而想要成为文学教授的人应该在英语文学和语言方面取得 5 分。
© 2025布莱恩·卡普兰 |
标准化测试的真正问题是什么
GRE<SAT<MCAT<普特南
͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏