Skip to content

搞英语 → 看世界

翻译英文优质信息和名人推特

Menu
  • 首页
  • 作者列表
  • 独立博客
  • 专业媒体
  • 名人推特
  • 邮件列表
  • 关于本站
Menu

标准化测试的真正问题是什么

Posted on 2025-04-16
open?token=eyJtIjoiPDIwMjUwNDE1MTUwMzA2L

GRE<SAT<MCAT<普特南
͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏

转发此电子邮件? 在这里订阅以了解更多信息
https%3A%2F%2Fbucketeer-e05bbc84-baa3-43

标准化测试的真正问题是什么

GRE<SAT<MCAT<普特南

布莱恩·卡普兰
4月15日
https%3A%2F%2Fbucketeer-e05bbc84-baa3-43
https%3A%2F%2Fsubstack.com%2Ficon%2FLuci
https%3A%2F%2Fsubstack.com%2Ficon%2FLuci
https%3A%2F%2Fsubstack.com%2Ficon%2FLuci
https%3A%2F%2Fsubstack.com%2Ficon%2FNote

在应用程序中阅读https%3A%2F%2Fsubstack.com%2Ficon%2FLuci

标准化测试是光荣的,但许多标准化测试却很糟糕。

最糟糕的考试几乎肯定是研究生入学考试(GRE)。 大约 9% 的考生在考试的数学部分获得 170 分的满分。 169 分使您处于第 87 个百分位,而到 166 分您就已经脱离了前四分之一。大多数参加考试的 STEM 专业的学生在中学时就完成了相关课程,因此对于强调数学的领域,分数稍低主要不是因为不理解,而是因为粗心。

当你记得只有顶级项目才是高度选择性的时,这尤其荒谬。因此,当重点标准化考试将所有顶尖学生聚集在一起时,考试的价值几乎为零。至少在 STEM 领域,GRE 的目的不再是确定哪些明星值得进入顶尖项目。重点是淘汰那些明显不合格的人。所以最终的剪辑几乎必须是怪诞的“整体”。

相比之下,常规 SAT 数学要好得多。 大约 1% 的人获得满分——大约是 GRE 数学获得满分的比例的十分之一。但从绝对值来看,SAT 仍然很糟糕。至少对于 STEM 学生来说,问题很简单,因此分数稍低主要是因为粗心而不是不理解。由于大约有 200 万学生参加 SAT 考试,大约有 20,000 名学生拥有完美的数学成绩—— 足以填补常春藤盟校的所有名额。

YARN | Find all the mutants. Find them all. Each one. All of them. | X-Men:  X2 (2003) | Video gifs by quotes | fce3aa0f | 紗

一流的标准化考试是什么样的?如果您决心找到最好的人,您会使用哪种测试?首先也是最重要的一点:完美的分数应该是非常罕见的。您应该能够清楚地区分 99% 与 99.9%、99.99% 等,而不是将最佳候选者聚集在一起。

在所有著名的标准化考试中,医学院入学考试(MCAT)最能满足这些条件。奇怪的是,满分是 528 分。在某一年中获得 528 分的比例约为 0.02% 。即使分数为 522,您也可以超过 99.5 个百分位数。这是完整的分布:

https%3A%2F%2Fsubstack-post-media.s3.ama

要了解 MCAT 相对于 GRE 数学的优越性,请考虑以下因素:GRE 数学 800 分中的 800 分与528 分中的516 分处于相同的百分位数 在 MCAT 上。想象一下,将所有分数在 516 到 528 之间的医学院申请者纳入其中,然后将他们归为一个类别。 GRE数学就是这么糟糕。

然而,经过进一步反思,即使是 MCAT 也需要进行重大改进。要进入任何医学院,您通常需要在考试中取得前三分之一的成绩。因此,几乎没有必要区分糟糕的申请者和一般的申请者。当您的目标是找到最好的测试时,理想的测试要求非常高,以至于您得到的一大堆分数不是分布的顶部,而是底部。

至少存在一种这样的标准化测试: 普特南竞赛。正如您所期望的,这是对数学能力的测试。称该测试“困难”是一种严重的轻描淡写:2025 年, 中位分数为2 分(满分 120 分) 。创历史新高!多年来,大约 4000 名经过严格筛选的考生的中位数分数恰好为 0。在分布的另一端,只有五个满分。这是 Grok 对典型年份直方图的尝试:

 Score Range | Frequency (Number of Students) --------------------------------------------- 0–1 | ************************ (2,400) 2–10 | ********** (1,000) 11–20 | **** (400) 21–40 | ** (160) 41–60 | * (32) 61–80 | (6) 81–120 | (2) ---------------------------------------------

为什么顶尖项目不改用像 Putnam 那样的测试,或者至少是 MCAT? 觉醒是显而易见的答案。反功德战争中有很多防线。首先是完全废除标准化测试。第二是“测试可选”。但如果这些方法过于公然腐败,还有第三种选择。这是一种隐秘的方式,假装申请人比实际情况更加平等。

只需使用糟糕的顶部编码测试即可。

但公平地说,早在 90 年代,即觉醒爆发前的二十年,GRE 数学就已经很糟糕了。因此,很多问题都只是羊群效应:如果其他所有顶级工程项目都使用 GRE,那么即使替代测试是一种更优越的选择机制,要求不同的测试也太奇怪了。

解决方案(如果存在)必须来自高层。如果麻省理工学院改用普特南式的入学考试,世界顶尖的 STEM 学生将不会犹豫。如果书呆子教授们曾经有过重新确立我们对招生的控制权的好时机,那么现在就是时候了。谁和我在一起?

PS 只需参加 AP 微观经济学和 AP 宏观经济学考试,就可以大大提高研究生经济学课程的入学率。它们都是有缺陷的测试,但如果你在两项测试中都不能得到 5 分,那么你还没有准备好进入研究生院。事实上,如果课程要求所有学科相关的 AP 成绩都达到 5 分,那么研究生入学率可能会全面大幅提高。想要成为历史学家的人应该在美国、欧洲和世界历史上取得 5 分才能申请,而想要成为文学教授的人应该在英语文学和语言方面取得 5 分。

升级至付费
https%3A%2F%2Fsubstack.com%2Ficon%2FLuci喜欢
https%3A%2F%2Fsubstack.com%2Ficon%2FLuci评论
https%3A%2F%2Fsubstack.com%2Ficon%2FNote重新堆叠

© 2025布莱恩·卡普兰
布莱恩·卡普兰,MSN 1D3,乔治梅森大学
费尔法克斯, 弗吉尼亚州 22030
退订

获取应用程序 动笔

open?token=eyJtIjoiPDIwMjUwNDE1MTUwMzA2LeJw8kEmu5CAQBU_z2bWVzHjBWSyGdDVqG0qQVMm3

原文: https://www.inoreader.com/article/3a9c6e77d548c74f

本站文章系自动翻译,站长会周期检查,如果有不当内容,请点此留言,非常感谢。
  • Abhinav
  • Abigail Pain
  • Adam Fortuna
  • Alberto Gallego
  • Alex Wlchan
  • Answer.AI
  • Arne Bahlo
  • Ben Carlson
  • Ben Kuhn
  • Bert Hubert
  • Bits about Money
  • Brian Krebs
  • ByteByteGo
  • Chip Huyen
  • Chips and Cheese
  • Christopher Butler
  • Colin Percival
  • Cool Infographics
  • Dan Sinker
  • David Walsh
  • Dmitry Dolzhenko
  • Dustin Curtis
  • eighty twenty
  • Elad Gil
  • Ellie Huxtable
  • Ethan Dalool
  • Ethan Marcotte
  • Exponential View
  • FAIL Blog
  • Founder Weekly
  • Geoffrey Huntley
  • Geoffrey Litt
  • Greg Mankiw
  • Henrique Dias
  • Hypercritical
  • IEEE Spectrum
  • Investment Talk
  • Jaz
  • Jeff Geerling
  • Jonas Hietala
  • Josh Comeau
  • Lenny Rachitsky
  • Liz Danzico
  • Lou Plummer
  • Luke Wroblewski
  • Matt Baer
  • Matt Stoller
  • Matthias Endler
  • Mert Bulan
  • Mind Matters
  • Mostly metrics
  • Naval Ravikant
  • News Letter
  • NextDraft
  • Non_Interactive
  • Not Boring
  • One Useful Thing
  • Phil Eaton
  • Product Market Fit
  • Readwise
  • ReedyBear
  • Robert Heaton
  • Rohit Patel
  • Ruben Schade
  • Sage Economics
  • Sam Altman
  • Sam Rose
  • selfh.st
  • Shtetl-Optimized
  • Simon schreibt
  • Slashdot
  • Small Good Things
  • Steve Blank
  • Taylor Troesh
  • Telegram Blog
  • The Macro Compass
  • The Pomp Letter
  • thesephist
  • Thinking Deep & Wide
  • Tim Kellogg
  • Understanding AI
  • Wes Kao
  • 英文媒体
  • 英文推特
  • 英文独立博客
©2025 搞英语 → 看世界 | Design: Newspaperly WordPress Theme