本文来自微信公众号:城市数据团,作者:chenqin,题图来自:AI生成
本文来自微信公众号:城市数据团,作者:chenqin,题图来自:AI生成
在学生的升学过程中,学校的作用到底有多大?
到底是好学校成就了好学生,还是好学生成就了好学校?
难以否认的是,好的学生绝大部分会选择好的学校,从而将学校的作用和生源特征混杂在一起。如何将学校的作用、学生的禀赋和努力,以及学生背后的家庭的作用完全区分开,是横亘在这类研究面前的巨大难题。
为了将学生的效应和学校的效应区分开来,让被学校录取的学生和没有被录取的那些学生在特征上尽量保持一致,一切可以用到的“自然实验”都被经济学家拿来做了研究。
比如学区边界附近的学生,一条街区的奇数号能进这所学校,马路对面的偶数号不能进这所学校,但是这条路两边的学生可能是差不多的。
或者分数线边界附近的学生,高一分就能进这所学校,低一分不能进这所学校,但高一分和低一分也具有相当大的随机性,这两类学生可能也是差不多的。
只有当进入某学校和没有进入某学校的两组学生在各种维度上都差不多的时候,“好学生选择好学校”的效应才能被去除,学校本身的价值才可能被计算出来。
但是,这样划分只能做到“近似”,却无法让两类学生真正一致。街道的一边是一个学区,另一边是另一个学区,马路两边可能就存在相当价差,进而导致选择马路两边住房的家庭和孩子本身就有很大区别;分数线上下一两分之差可能还有一定随机性,但学者为了纳入足够样本往往会考虑分数线上下更高的“带宽”,而在考试中相差5分以上,学生和学生之间可能已经存在统计上的差异了。
将不同学生随机分开的方法,还有一种——摇号/抽签。用纯粹的运气挑选能/不能进入某些学校的学生,这也是世界上对不同学校教育效应研究的最广泛使用的“自然实验”。
使用抽签结果来研究学校效应的文献,最有名的莫过于《魔鬼经济学》作者Levitt在2006年发表在Econometrica的文章《The Effect of School Choice on Participants: Evidence from Randomized Lotteries》,使用芝加哥公立学校的抽签政策,对比那些抽签成功的学生和抽签失败的学生,Levitt发现“好”的学校并不能给学生带来学业上的增加值。换言之,“好”学校没法让学生的成绩更好。
虽然这个结论在多年前就被人们熟知,但它似乎并没有在多大程度上影响人们的选择。家长们还是对于“好”学校趋之若鹜。一方面,抱有一些成绩之外的期待,比如希望孩子可以碰到更好的同学,更好的环境;另一方面,则是对于学校对学生的成绩影响,存在一些怀疑——Levitt的研究,毕竟是20年前的芝加哥公立学校,有多大普适性?现在还适用吗?在中国适用吗?在上海这样民办学校远好于公办学校的地区,仍然适用吗?
在这样的心态影响下,上海的民办初中,长久以来掐走了上海市的优秀小学生,这样的掐尖效应甚至能在多年后的高考中被观察到(可以看这篇)——全市高考前三名来自初中的同一个班级。
2020年的民办摇号政策,就是在这样的背景下出台的,民办学校被彻底(个别学校的个别班级除外)剥夺了选择好学生的权利,转而由电脑随机摇号来决定生源。2020年通过摇号入学民办学校的学生,2024年已经全部从所在初中毕业,其中大部分在上海进入了各所高中或者职校。而我们已经获取了其中绝大部分学生的就学去向,在此基础上,我们终于可以将这项重要的研究在上海再做一遍,重新回答一遍这个问题:
在上海,“好”学校对学生的学习成绩提高,到底有用吗?
摇号之后,民办和公办初中的差距缩小了吗?
我们收集了2024年所有杨浦区初中所有学生升学到杨浦区高中(市东实验和复旦实验这两所完全中学数据尚不完整)以及上海中学、复旦附中的情况。(2024年各区各校各班级完整升学数据将于年内发布)。
杨浦区最好的民办初中之一,上海市民办兰生学校,2023年和2024年的去向对比如下:
兰生中学去向复旦附中的比例,从34%下降到了14.3%,比例下降了超过一半。去向控江中学、杨浦高级中学和同济一附中等市示范高中的比例则从18.7%上升至24.7%,上升超过6%。去向其他区内高中的比例,从1.4%上升至9%。
而在杨浦区最好的公办初中之一,上海市铁岭中学,2023和2024年的去向对比如下:
今年铁岭中学有1.1%的学生进入了复旦附中,去向控江中学、杨浦高级中学、同济一附中的比例也从18%上升至21.6%,去向其他区内高中的比例则从31.8%下降至24.7%。
两者对比,民办学校去向四校等顶尖学校的比例降低,而普通市重点以及其他学校的比例提高。公办学校则相反,去向四校和顶尖区内市重点的比例明显提高,去向其他学校的比例降低了。
我们用2023、2024年每一所高中的最低录取分数线来作为每一个学生的考分替代指标,计算了2023和2024年杨浦区初中的“平均分数”变化,如下表所示:
可以看到,民办学校从2023年到2024年平均分数下降了21分,平均排名下降了4位。与之相比,公办学校的平均分数仅下降了12.3分(分数下降主要是因为2024年考卷更难),平均排名上升了0.9位。
2023年时,杨浦区的初中排名前七名中只有一所公办学校,复旦二附校,而复旦二附校的高分更多地依赖子弟班的高分,实际上也并非属于真正意义上的“公办”。因此,在掐尖学生考试的末年,在杨浦区初中的前列,是根本看不到公办学校的。
到了2024年,杨浦区的前六名高中就有三所公办学校了,复旦二附校仍然位居第二,十五中学和上海音乐学院实验学校也取代了民办杨实验、民办凯慧等学校的位置,分处第四、第六名。
相比最后一届“掐尖”学生,摇号学生元年的中考,公办学校和民办学校的距离确实更接近了。
但是,只能说是“接近”了,两者间的差距远未拉平。且不说前三名学校依然是民办学校或者是对口子弟班的“公办”学校,第四名上海市十五中学,也并非真正意义上的公办学校,而更接近一个民办学校的学籍挂靠点。在这类学校,许多学生实际上已经由其他民办学校通过神秘考招收,并集中在一两个班级中,实际在其他民办学校上课。这些学校内部,班级和班级之间的平均分可以相差几十分,那些落后几十分的班级,才是这些学校真正的学生。十五中学,正属于这类情况。
因此,如果只观察真正意义上的公办学校,只有上海音乐学院实验学校前进了两名在杨浦区进入了前六。2024年第一届摇号学生中,下滑较快的主要是原本处于二线的民办学校,一线民办学校依旧在杨浦区独占鳌头,优势难以打破。最好的民办学校和最好的公办学校之间的平均分数差距,仍然高达25分——虽然比起2023年的相差37分,差距已然缩小了不少。
民办学校对学生成绩提高有作用吗?
如果摇号都不能够打破民办学校的优势,是不是说明民办学校确实能够带来学生成绩的上升呢?
并不一定。
在前文中我们已经提到,要计算学校的作用,必须使用两群相似的学生,他们之间的各种特征差异极小,唯一的区别就是一群上了这所学校,而另一群上了另一所学校。
但是,民办学校摇号,并不能为我们的研究提供这样的两群学生——在民办学校的,是摇号入围的学生,而在公办学校就读的,除了摇号未入围的学生以外,还有大量根本没有去摇号,直接升学对口学校的学生。
大家都去摇号,那么摇号入围的那批,和摇号未入围的那批,可能只有运气上的差异。但是选择去摇号的学生,和不去选择摇号的学生,两者的差异可就太大了。直接对比民办学校和公办学校的考试成绩,其差异在很大程度上是这种选择性带来的。
要算出学校的效应,我们必须对比那些摇号录取和摇号未录取的学生——而非没有参加摇号的学生。
那么,有没有一组数据,能够让我们同时看到摇号录取的学生和摇号未录取的学生呢?
每年公布的民办学校电脑随机录取名单,并不包含随机未录取的学生名单。只有在一种情况下,会同时公布摇号录取和摇号未录取的学生名单,那就是在“民办一贯制学校”的直升过程中,见下图:
2020,民办学校的摇号元年,杨浦区的同大实验学校(2024年区内排名第七)和杨浦双语学校(2024年区内排名第五),之前采取的都是“择优录取”,2020年对直升学生也采用了摇号录取的方式。
132人和220人在这两所学校参加直升报名,但分别只录取了55人和106人。我们追踪到了该名单中所有学生在杨浦区的录取高中,并用和前文类似的方法,用录取高中最低分数线,代表每个学生的分数情况。
那么,在直升过程中被随机录取的学生,和未被随机录取的学生之间,存在分数上的显著差异吗?
从上图可以看到,被随机录取的学生,其录取分数确实高于未被随机录取的学生,在同大实验学校,两者相差7.2分,在杨浦双语学校,两者相差7.9分。
但是在两所学校,这个分数差异均在统计上不显著。在同大实验学校,p值为0.434,在杨浦双语学校,p值为0.24。
因此,虽然这两所学校已经算是杨浦区领先的民办初中,但直升这两所学校时摇号是否入围,并不能使得入围学生在四年后比起那些未入围的学生出现统计上显著的分数差异。
但我们同时注意到一点,即使是直升摇号没有入围的学生,也并非全部进入公办学校。
根据2020年的入学流程(见上图),民办一贯制入学摇号未录取后,未录取的那些学生仍然可以选择进入公办还是继续参加民办摇号入学。在这两所学校的学生中,确实有一些仍然被录取到了其他民办学校,甚至是仍然被本校录取。
那么,在直升摇号未被录取后,那些继续摇号,并成功进入民办学校就读的学生,和那些进入公办学校的学生,与一开始就摇号入围的学生之间,存在什么差异呢?
在上图中,摇号未录取的学生中,最终进入民办学校的学生和留在公办学校的学生,两者分数相差达到了15分,p值为0.079,民办学校和公办学校学生的分数差异,在10%的水平上显著了。但此时我们可以看到,摇号未录取的那些学生,如果进入了民办学校,那么他们的分数要比那些摇号入围的学生,还要更高5分。
“选择效应”大于“学校效应”
让我们总结一下从2020年直升摇号学生中观察到的现象。
1. 直升摇号录取和直升摇号未录取的学生,没有统计上显著的分数差异。
直升摇号录取的学生,必然进入这两所区内排名靠前的民办学校,直升摇号未录取的学生,大部分将进入公办学校。这两个群体之间分数没有统计上显著的差异,意味着至少在这两所民办学校,并不能比公办学校给学生带来更高的分数。
2. 那些直升摇号未录取的学生中,进一步进入民办学校的学生,和没有进入民办学校的学生,具有统计上显著的分数差异。
两组对比,都在民办学校和公办学校间进行,但其中一组不存在差异,另一组却存在差异。两者之间的区别在哪里?
前者,电脑摇号录取,和电脑摇号未录取,只有运气上的差异,其他特征没有高下。
后者,在直升录取失败后,仍然破釜沉舟继续选择民办学校的学生,和那些放弃了摇号,进入公办学校的学生,在主观选择上存在不同。
运气好坏,是否录取直升对口的民办学校,并不能使得学生的成绩出现差异。真正造成差异的,是在直升未录取后,“选择参加摇号”,还是“选择不参加摇号”。
3. 这些直升摇号未录取,继续参与摇号后仍然被民办学生录取的学生,分数甚至比直升摇号入围的学生分数更高。
最后终点都是进入民办学校,为什么是在第一步直升时“随机未录取”的那批人分数更高呢?
道理很简单,第一步直升摇号时运气不好,反而会比运气更好的那批学生多了一道选择——是否第二次继续选择摇号民办学校。这一道选择题,将运气不好却仍然进入民办初中的那批学生“选择摇号”的倾向,筛选得更浓了。
也就是说,选择了继续摇号,并承担风险的家庭和学生,以及在做出这个选择时蕴含的家庭背景、个人特征,才是真正造成学生成绩差异的部分。
到这里,我们终于可以回答文章开头提出的问题。
问:排名靠前的“好”学校,对于提升学生的成绩有用吗?
答:使用4年前直升摇号的结果来看,没有用。至少在杨浦双语学校,和同大实验学校这两所杨浦区排名第五、第七的初中,是否能够成功摇号直升,不会对四年后的成绩产生显著影响。
问:如果“好”的民办学校对提升成绩没有用,那么为什么即便采用了摇号录取的方式,这些民办学校在2024年的中考成绩仍然好于公办学校?
答:当民办需要摇号录取时,这类学校自然集中了所有选择摇号的学生,而做出了摇号选择的学生以及其背后的家庭,平均成绩仍然要远好于那些选择对口的学生。做出不同选择背后的家庭、个人特征差异,而非学校差异,才是造成成绩差异的根本原因。
问:如果摇号也不能做到义务教育均等化,如何做才能达到教育均等化呢?
答:自由选择必然造成同一个选择的人群聚集在一起。当造成某种选择的特征又和结果高度相关时(例如选择摇号和中考成绩高度相关),选择就不可避免地造成极化。均等化的过程,就是反其道而行之,消除选择,并用“运气”来代替个人选择确定性的过程。
也许最极致的均等化,是所有学生、家庭的主观选择空间都被消除,所有的学生在任何升学环节都无法选择学校,全部由抽签摇号替代吧。
可你愿意把自己的人生规划交给一枚骰子吗?
本文来自微信公众号:城市数据团,作者:chenqin
支持一下 修改