年薪200万所以去读博?3962名物理博士真实数据大揭秘
2019-07-25 17:52

年薪200万所以去读博?3962名物理博士真实数据大揭秘

本文来自微信公众号:集智俱乐部(ID:swarma_org),作者:陈曦,标题图来自视觉中国


导语


应届博士毕业生年薪200万的案例正在被热议。一方面优秀的博士生非常抢手,另一方面博士延期毕业率一直居高不下。而在一项发表在Science Advances的论文中,研究者基于数千名美国物理学博士生数据,发现能否拿到博士学位,和是否申请到博士入学资格关系不大,和本科成绩关系很大。


物理学作为学科基础中的基础受到各个国家的重视,博士学位作为从事物理学研究的入场券,是每一位有着科学情怀,立志于揭示世界运行规律的物理系学生到物理学家这条路上的必需品。获得物理学博士的过程是一场漫长的战斗,但是能不能打赢这场仗似乎和你入学前的考试成绩关联性不大。


来自罗切斯特理工大学的研究团队对2000年到2010年27所机构3962名物理学博士生的标准化成绩进行了分析,分析结果指出,过去常用的物理学入学指标和你能否拿到学位之间没什么相关关系。


博士录取路上障碍重重


受到第二次世界大战的影响,德国世界物理学研究重心的位置受到了挑战,曼哈顿计划的成功使得世界物理的研究重心移向美国,自此奠定了至今为止长久以来的格局。每年,世界各地的毕业生们怀着对物理学的敬畏之心敲开物理学院的大门。他们不仅仅要有漂亮的本科成绩,一份出色的研究生标准入学考试成绩单,并且这些标准化数字只是入学门槛中的一部分。美国高校长久以来依赖研究生入学考试成绩作为决定研究生或者博士能否入学的评判标准之一。历史数据表明入学考试成绩在预测研究生项目成就上有一定的显著性。但是,不同即存异,越来越多的证据表明,考试考得好对博士毕业没多大帮助。


今年发表在Science Advances上的一篇文章揭开了科研成就与学习能力之间关系面纱的一角,这项研究意在了解现阶段物理学博士录取标准的有效性,即传统的录取标准是否能够预测学生的博士毕业。它涵盖了2000年到2010年约占八分之一的物理学博士生的入学标准化成绩与他们能否毕业之间的关系,指标包括物理学入学通用的本科平均绩点(GPA)、美国研究生入学考试成绩(GRE)定量分析(Quatitative)、阅读理解(Verbal)与物理子项目(Physics Subject Test)的成绩。博士录取委员会一直“觉得”使用这些成绩选拔出的博士生更加优秀,但是研究结果却持有相反的答案。


论文题目:

Typical physics Ph.D. admissions criteria limit access to underrepresented groups but fail to predict doctoral completion


论文地址:

https://advances.sciencemag.org/content/5/1/eaat7550


GRE,用这门考试预测未来学生的学术成就的研究几乎和这门考试有着同样长度的历史,数十年间不断得有研究尝试优化这门考试。但是越来越多的证据表示GRE虽然能预测一些硕士阶段的成绩,但是它与博士学位的获取没有太多的关联性。现阶段存在一些已有的研究多集中在单因素回归分析上,证明了GRE成绩对研究生院学生“成就”的预测性会随着时间的迁移会慢慢降低,对于博士生而言就是博士完成度,科研产出和其他成就相关的指标。而为了揭示更精确与细节化的信息,作者在此项研究中使用了多因素的统计分析。


统计建模揭示招生与毕业关系的迷思


本研究从大学官方录取信息中获得了3962名学生的背景信息与学位完成程度,覆盖了研究时间段内13%被博士项目录取的学生。我们将“获得博士学位”视作候选人“背景信息”的函数,其中包括:本科平均绩点(GPA),美国研究生入学考试成绩(GRE)定量分析(Quatitative),阅读理解(Verbal)与物理子项目(Physics Subject Test)的成绩,性别,国别(分本土与非本土),人种与博士项目质量。有了这些数据,就可以进行多元逻辑斯蒂回归分析(multivariate logistic regression)


“多元”回归分析对应传统常用的单变量“一元”回归分析。面对复杂性强的问题多元回归能够同时考虑更多自变量与因变量的关系,而合适因素的叠加往往能解释因变量变化的更多细节。例如,想预测面包价格的波动,光参考面粉的价格不够有效,但是如果再加上鸡蛋牛奶的价格与烹饪师傅的工资,预测模型就能覆盖到由于这些附加因素引起的价格波动。


在这里,论文作者使用的Logistic回归,是一种适用于离散因变量的回归分析手段。它适合用于分析医学上的生存-死亡、赛马比赛种的赢-输等等。在这里,“完成博士学位”和“未完成博士学位”就是离散的因变量。因为毕业“概率”是一个在0到1之间波动的小数字,所以在这个回归分析模型中,需要将“概率”1对1转化成“胜率”(Odd)胜率是说一件事情成功的机率比上这件事情失败的概率,这个指标的值从0到正无穷,从而帮助衡量自变量的影响,后文中我们评价某个指标的效益,计算的都是指标对胜率的影响大小。


图1:线性回归和逻辑斯蒂回归的区别 图片出处:Data Camp


为了分析的有效性,研究人员们分别对全部样本以及依据性别,国别,分组后的数据进行了同样的回归分析以观察组别之间是否存在差异。四个组分别是美国女性(U.S. female)、美国男性(U.S. male)、仅美国(U.S. only)和全部学生(and all students).


读完博士的概率,与什么有关?


他们的研究结果表明,本科平均成绩(UGPA)和研究生项目质量是所有模型中唯二具有普遍显著性的参数,研究生入学考试定量部分仅在四组中的两个分组具有显著性(全部参数数值以及显著性水平见文章后部附表1)。感兴趣的读者可以拉到文后去读一读统计结果中的OR值(Odd Ratio),它用来衡量每一单位自变量的变化对博士毕业“胜率(Odd)”的倍数影响,比如在所有结果中OR值比较可观的项——美国女性组中的本科平均成绩的OR值为2.5,就可以解释成GPA每提升一分,这名学生的胜率就要乘以2.5。


与公众所认为的不同的是,排名越高的博士项目的完成概率反而更高,而不是因为其高难度而降低毕业可能性。但是在录取之前,研究生项目并不是一个学生携带的确定指标,所以在学生入学前能够普遍预测毕业可能性高低的显著指标只有本科平均成绩。


一直以来在博士生录取中占比很大的美国研究生入学考试(GRE)在这项研究中确没有表现出与毕业可能性极强的相关性,其中定量分析部分在四个分组中的两个中存在显著性(P<0.05)而在另外两个模型中不存在。我们可以从GRE考试所能衡量的和不能衡量的功能出发理解它较低的解释度:一天一次的考试只代表一小部分学生的技能,而不是一个人的综合能力,尤其是考虑到这些考试不是用来衡量研究潜力的。本科GPA囊括了四年时间内综合能力的评价,因此具备了更高的解释性。


在各个分组中,仅美国组和美国男性组的统计结果十分相似,这符合直觉,因为仅美国组样本中80%的学生是男性。


正如我们之前说的,所有指标中除了本科平均成绩(UGPA)、博士项目排名与部分GRE成绩以外的指标都不具有相关性,这也就证明在这个研究的背景下,性别,公民身份,人种都不会影响博士的毕业率。


图2:仅美国(US-Only)组的多元逻辑回结果,在控制其他所有变量的条件下本科平均成绩(UGPA)、美国研究生入学考试定量分析部分(GRE-Q)具有显著性,其中P-value分别为 P<0.001和P<0.05,剩下两项不存在显著性。


物理博士入学指标作用有限,但能成功筛掉不善考试的学生


虽然论文的分析显示,所有的统计模型中只有本科平均绩点与完成博士学习之间显示出了显著相关性;GRE定量分析部分则在四个模型中的两个中存在显著性。即便如此,我们必须要强调的是,GRE定量成绩从位于90%名次到位于10%名次只会造成不到10%的博士完成可能性波动,GRE阅读理解和GRE物理子项目则在任何模型中都不存在显著性。如图所示,GRE在不同群体的考生中具有差别,这导致平均具有更低分数的学生群体会在录取中占据劣势。它不能够筛选出具备毕业潜力的博士生,但是会成功将不擅长考试但是有完成博士学习能力的群体拒之门外,如图3所示是不同背景学生美国研究生入学考试物理分项的平均考试成绩分布。


图3:GRE成绩不能代表博士毕业的可能性,但是会系统性筛掉低分群体


启示:如何选拔适合读博的人


作者撰写文章意在呼吁一个更加公正的博士生入学平价标准,物理学一直以来与机械工程,航空航天工程并列为多样性最低的STEM(science,technology,mathematics and engineering)学科。已有的录取准则对选择具备学术潜力的物理学博士候选人帮助不大,但是却系统地过滤所有种族和国籍的女性,西班牙裔,黑人和美洲原住民。少于5%的博士学位被授予少数族裔,女性获得学位的量占比20%以下。这种差异通常被认为始于早期的教育资源不公平,刻板印象等的系统性,长期的威胁与影响。美国国家科学院的一篇报道指出,科学的将来很大程度上是由被录取进入博士项目的人所决定的,今日的博士中会产生将来的学者,一个职业学者须具备博士学位。如果录取存在偏颇,不仅仅人才被埋没,也会影响到整个科学领域的未来。


如何保证博士选拔过程公平公正是一个普世的问题,大学的录取委员会需要对指标进行重新审视。虽然这项研究基于美国教育的体系,但是基于结果的一些规律是可迁移且值得深思的。已有的研究告诉我们博士生被录取和学习的环境对他们的成功很重要,督促学术界为将来的新鲜血液创造有利的学习环境;短期爆发的考试成绩对长远将来的学术成就影响不大,因为博士学习是一个漫长且回报缓慢的过程;而能揭示长期学习成果的GPA则在预测4~6年以后的博士完成度上相对而言更有说明性,暗示具备“长跑”能力的学生有着更高概率渡过学术路上的漫漫长夜。


Logistic回归结果


本文来自微信公众号:集智俱乐部(ID:swarma_org),作者:陈曦,标题图来自视觉中国

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定