新浪博客

大数据:哪个省才是高考地狱模式?结论和想象不太一样

2020-11-29 11:16阅读:
前言
大数据:哪个省才是高考地狱模式?结论和想象不太一样
不同省份的高考难度,一直是一个撕扯严重的问题。当然了,每个地方的人,都会觉得自己是比较难的那一个。因为其实不管在哪里,高考都是件不容易的事情。但是周围的人讲什么地方考试难,部分人都是以主观体验或者单一指标来讲的,比如周围学霸如何多,考试分数如何高,每天学习如何晚,主观体验,每个人都是不同的,就会出现撕逼许久,撕不出结论的情况。而本文,我们希望以若干个客观指标的量化比对,来评价并排序中国各省的高考难度,看一看哪些省份高考是地狱模式,哪些省份高考是简单模式,量化的指标,是客观的,这样的评价,是争议更小的。
中国高考有一个好处,就是最终评价指标是一维且线性的,即同省份内每个人的高考的成绩,是可以直接比对的,这样,对“好”的评价,就变得很公平,而基本上,学的排名,也很程度上符合高考分数,“更好的学”一般对应“更高的高考录取分数”。清华北优于985/211学,985/211学优于普通一本,一本优于普通二本三本。当然也有特殊情况,我们这边讨论普遍情况。
但高考录取,本质上是一种“省内筛选”,是全国各个高校,以省(直辖市,自治区)为单位进行招收录取的,高考的竞争,也是一种“省内竞争”,而各省之间的录取难度是有所不同的。我们今天,就是希望能够通过量化指标,比对各省高考的难度差异。
摘要(具体内容和过程会在下文第4章详细论述)
大数据:哪个省才是高考地狱模式?结论和想象不太一样

各个省份之间高考难度是不同的,而各省高考的“竞争激烈程度”,其实是有可比量化指标的,通过这些指标可以横向对比各省之间的高考竞争激烈程度。我们采取的指标是“录取率”(或者说考取率),即“该省所有高考人数中,考上XXX(985/211/一本/清北)的比例”。
录取率是一个相当可测可比的指标,和人口和录取数量都有关,因为现行高考体制其实本质上是省内竞争,即不同的学校对不同的地区其实是有招生指标的,故若一个地区好学校录取率低,则反映这个地区高考竞争激烈程度高。我们认为用录取率来衡量高考激烈程度,是比用“高考人数”和“录取人数”更优的。不管该地区好学校多寡,人口多寡,录取率总是一个比较客观可比的因素,我好学校少,但985整体录取率(考取率)高也行啊,我人少,但是别的学校给我们名额也相对更少,也没用,所以“录取率”是更客观可比的指标。
而这三个指标中,我们设定每个指标满分都是100分,最低分是40-45分,而该指标处于全国平均水平时,我们给其打65分,故整个分数波动范围是120-300分,全国平均水平应该是195分。

结果可以看到,得分最低的地区,只有145分,而得分最高的地区,有290分,不得不说是很的差距。我们按照高考优势程度,把全国不同省份分为6档难度,高考最简单的为第1档,高考最难的为第6档,按照不同难度,将全国不同地区高考分为优惠模式,普通模式,困难模式,噩梦模式和地狱模式。1-3档(优惠模式,普通模式)是比全国平均值是容易的,4-6档(困难模式,噩梦模式,地狱模式)是比全国平均程度难的。新疆的总体高考难度恰好和全国平均平齐。
第1档地区(优惠模式)
北京,上海,天津
第2档地区(优惠模式)
西藏,青海,宁夏,吉林,辽宁
第3档地区(普通模式)
福建,海南,湖北,陕西,黑龙江,内蒙古,新疆
第4档地区(困难模式)
重庆,浙江,湖南,江西,河北,江苏,贵州,甘肃
第5档地区(噩梦模式)
山东,四川,云南,安徽,广西,山西
第6档地区(地狱模式)
广东,河南

印象流的事情很多,我们就是希望用数据量化的方式,打破印象流,构筑更量化客观的评价体系。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
大数据:哪个省才是高考地狱模式?结论和想象不太一样
1首先我们得有个概念——高考是个什么难度级别的考试
大数据:哪个省才是高考地狱模式?结论和想象不太一样
首先从全国总体来看,实际上,能考上学的人,没有很多人想象的那么多。
中国每年出生人口在1500-2500万。现在参加高考的人是2000年左右出生的,每年——
全国出生人口约1900万(100%),这其中,
全国参加高考的人约是920万人(48%),
全国本科录取人数约309万人(16%),也就是说,不管你被什么本科录取了,就算是最普通的三本,也已经是6选1的突出人才了,
全国一本录取人数是114万人(6%),也就是说,不管能考上什么样的一本学校,都已经是16选1的精英了。这还是这几年一本规模扩范围后的情况。即便一本高校范围扩了很多,录取一本依然是一件只有6%概率的很难的事情。
全国211高校录取人数约46万人(2.4%),也就是说,全国同龄人中只有2.4%的人能考上上211高校,这些高校包括东北林业学,太原理工学,延边学这样的,很多人可能并没有听说过的学校,很多人可能并不觉得能考上个东北林业学,延边学是件特别厉害的事情,但是,能考上这些学校的,已经是40选1的超级精英了。
全国985高校录取人数约15万人(0.8%),也就是说,考上985高校,实际上是战胜了99%的同龄人的。如果你周围有中国海洋学,西北农林科技学等学校的同学,你可能觉得,他也就是个普通的同学,但是如果有人告诉你,某件事情,99%的人都会被淘汰,做不到,只有1%的人能做到,你可能又会觉得能做到这个事的人特别厉害,实际上,这两件事是同一件事。能考上中国海洋学,西北农林科技学或其他任何一所985高校,就是击败99%的同龄人,精英中的超级精英。
全国清北录取人数约6600人(0.03%),清华和北,无疑是中国的TOP2高校。当然这6600人,主要是指通过高考和统一自主招生录取的普通学生,实际上清北每年本科生招生还会多一些,比如有特殊荣誉的人(比如运动员),海外学生等。从高考渠道录取的6600人来说的话,清华北在同龄人中的录取率,仅0.03%,万里挑三,堪称人中龙凤。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
总体来说,虽然你可以感觉你周围很多985,211,甚至清华北的朋友,但是这可能是幸存者偏差,高考这个考试可能比很多人想象的难得多。同龄人中能上本科的比例16%,一本的比例6%,211的比例2.4%,985的比例0.8%,清北的比例0.03%。
2未来高考人数会变少吗?——2035年以前至少不会
大数据:哪个省才是高考地狱模式?结论和想象不太一样
另一个问题,很多人可能会说,“中国出生人口不是变少了吗?高考人数也应该变少了吧,未来高考应该不会这么难了吧。”
答案是否定的,至少到2035年前,高考只会竞争越来越激烈。
一般人高考要到18岁,所以我们往前推18年来计算适龄人口数,以出生人口计算,2024年左右是高考适龄人口最少的一年,从2024年,到2034年,高考适龄人口都会持续增长,所谓出生人口出现下滑,是2018年的出生人口,那么基本上来说,需要到2036年,这部分出生的人口,才会参与高考,至少2035年前,高考竞争都会变得越来越激烈。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
而另一方面,尽管2015-2018年高考适龄人数是在减少的,但是高考人数其实是增加了的。这体现了高考参考比例的一个提高,一方面也反映出,中国教育这几年其实是发展了,为更多人提供了参考机会。但不管怎么说,高考的竞争烈度在2035年之前,都可预见的会越来越激烈。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
3全国各地高考人数差异巨——有的省100万考生,有的省只有2万
大数据:哪个省才是高考地狱模式?结论和想象不太一样
大数据:哪个省才是高考地狱模式?结论和想象不太一样
各省高考人数是差异巨的,以2018的数据来看,河南近100万考生,广东75万,山东&四川&安徽也都是50万+的级别,但西藏,青海,上海等地高考人数不足5万。
高考人数是各地高考难度差异最的基本盘,但是各地录取人数也不是完全跟着人口走的,更重要的反映高考经济激烈程度的指标是录取率。我们更倾向于用录取率指标来描述各地高考难度。有些地方人口虽然不多,但是录取也不多(如海南),所以总体来说,还是用录取率衡量,更符合实际情况一些。
大数据:哪个省才是高考地狱模式?结论和想象不太一样

4客观量化打分——各地高考难度评级
大数据:哪个省才是高考地狱模式?结论和想象不太一样
终于到重头戏了,我们试图用量化的方式,来客观评价各地高考的难度。而因为中国高考的公平,线性可比等因素,我们评价各地“高考难度”我们采取的方式是评估各地“高考竞争激烈程度”。
而“竞争激烈程度”,其实是有量化指标的。我们采取的指标是“录取率”(或者说考取率),即“该省所有高考人数中,考上XXX(985/211/一本/清北)的比例”。
录取率是一个相当可测可比的指标,和人口和录取数量都有关,因为现行高考体制其实本质上是省内竞争,即不同的学校对不同的地区其实是有招生指标的,故若一个地区好学校录取率低,则反映这个地区高考竞争激烈程度高。我们认为用录取率来衡量高考激烈程度,是比用“高考人数”和“录取人数”更优的。不管该地区好学校多寡,人口多寡,录取率总是一个比较客观可比的因素,我好学校少,但985整体录取率(考取率)高也行啊,我人少,但是别的学校给我们名额也相对更少,也没用,所以“录取率”是更客观可比的指标。
而为了减少偶然指标扰动,我们采取多维度“3+1”评估模式,3即“985录取率”,“211录取率”,“一本录取率”三个录取率来计算得分,加上一个“清华北录取率”进行额外评判(因为方差过,这个指标不算得分),最后进行得分排名。
有些地方985录取率高,但是一本录取率低,有的地方211录取率低,但是一本录取率高,各地皆不一样,所以我们采取三个指标的共同排名来评估各地高考竞争烈度,一定程度也能指导民办高校的扩张方向——“向更需要高校的地方去扩张。”
而这三个指标中,我们设定每个指标满分都是100分,最低分是40-45分,而该指标处于全国平均水平时,我们给其打65分,故整个分数波动范围是120-300分,全国平均水平应该是195分。

结果可以看到,得分最低的地区,只有145分,而得分最高的地区,有290分,不得不说是很的差距。我们按照高考优势程度,把全国不同省份分为6档难度,高考最简单的为第1档,高考最难的为第6档,按照不同难度,将全国不同地区高考分为优惠模式,普通模式,困难模式,噩梦模式和地狱模式。1-3档(优惠模式,普通模式)是比全国平均值是容易的,4-6档(困难模式,噩梦模式,地狱模式)是比全国平均程度难的。新疆的总体高考难度恰好和全国平均平齐。
第1档地区(优惠模式)
北京,上海,天津
第2档地区(优惠模式)
西藏,青海,宁夏,吉林,辽宁
第3档地区(普通模式)
福建,海南,湖北,陕西,黑龙江,内蒙古,新疆
第4档地区(困难模式)
重庆,浙江,湖南,江西,河北,江苏,贵州,甘肃
第5档地区(噩梦模式)
山东,四川,云南,安徽,广西,山西
第6档地区(地狱模式)
广东,河南

这个结果是用各省三项录取率总体加分得到的,可以说是量化且客观程度较高的评分。
北京,上海,天津雄踞前三,这个意料之中,但这并非直辖市的问题,同样作为直辖市的重庆只排在第16,西藏,青海,宁夏,紧随京津沪其后,都是高考比较友好的地区,也算是印象中的事情,而吉林,辽宁高考也很友好,这个之前印象不深。
河南位列倒数第一,堪称全国高考最不友好的地区,这个也是印象中的事情。但是广东排倒数第二,让人有点惊讶,确实,广东人口众多,高考人数也众多,但是本地高校并不算突出,录取程度也较低,是全国最需要补足的地区之一。难得的是,广东这么多年,一直是处于地狱模式的高考,但是却没有人经常提。
此外,山东虽然人也很多,高考虽然也很不友好,但是比河南广东还是稍微友好一些。
从录取率上来说,江苏和湖北,这两个传统印象中的“高考熔炉”,其实没有那么难,也就是处于普通模式,或者困难模式。
印象流的事情很多,我们就是希望用数据量化的方式,打破印象流,构筑更量化客观的评价体系。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
大数据:哪个省才是高考地狱模式?结论和想象不太一样
接下来,我们来分析一下各省具体的录取率和打分数据

全国各省985高校录取率
985录取率指该省所有高考考生中,被985高校录取的人数比例。
从985录取率来看,全国平均约是1.62%(这个是所有高考考生为分母,而不是所有高考适龄人口做分母)。
新疆,湖南致是处于全国平均水平的,评65分,天津5.9%,上海5.3%,北京4.3%远高于全国平均水平,吉林,青海也都在3%以上。
而985率最低的地区,是安徽,河南等地,约在1.1%左右。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
大数据:哪个省才是高考地狱模式?结论和想象不太一样
全国各省211高校录取率
211录取率指该省所有高考考生中,被211高校录取的人数比例。
从211录取率来看,全国平均约是5.01%(这个是所有高考考生为分母,而不是所有高考适龄人口做分母)。
北京14.0%,上海13.58%依然是遥遥领先,而天津不是第三,第三的是西藏,西藏的211录取率超高(和其高考考生本身只有2万多有关),但是其实西藏的985录取率并不那么高。天津,青海,吉林,宁夏等地区依然是非常友好,录取率较高。
江苏,贵州,湖北等地,211录取率接近全国平均水平,评65分。
而广东位列这个榜单倒数第一,甘肃安徽分别列倒数二三位,广东作为全国数一数二的人口省,教育资源实在谈不上优秀,急需补足。
大数据:哪个省才是高考地狱模式?结论和想象不太一样
大数据:哪个省才是高考地狱模式?结论和想象不太一样
全国各省一本高校录取率
一本录取率指该省所有高考考生中,被一本高校录取的人数比例。
从一本录取率来看,全国平均约是12.43%(这个是所有高考考生为分母,而不是所有高考适龄人口做分母)。
北京一本录取率30.5%,继续雄居全国第一,而且显着高于天津的24.1%和上海的21.8%。但是京津沪还是无悬念位列前三。西藏一本率缺失,没有有效数据,我们采取西藏211录取率的得分来代替。其后宁夏,福建,海南,辽宁等地都是一本录取率比较高的地区。
吉林,新疆一本率接近全国平均水平,评65分。吉林在一本率上,并非特别突出。
而一本率排行倒数的,包括河南,广西,山西,江西等,都是一本录取率较低的地区,这也比较符合一般印象。
大数据:哪个省才是高考地狱模式?结论和想象不太一样

我的更多文章

下载客户端阅读体验更佳

APP专享