2024清华大学软件学院免试推研录取情况不专业分析暨尘埃落定后的碎碎念

发布于 2023-11-15  4,443 次阅读


前言

虽然在几乎两个月前(23/9/8)2024清软推研结果就已确定,但一直拖到今天(23/10/31)清软才终于在官网上公示拟录取名单,这也成功激起了我对我升学之途进行梳理的欲望。本来之前接受清华系统拟录取的时候就已经向G1ers说过有空一定要写一路走来的心路历程,但一直也没能挤出一篇可堪卒读的像样点的东西,就拖拖拉拉到现在。今天算是又一个契机,虽然最近ddl已经有些要追上来的趋势,不过还是希望这篇文章不要虎头蛇尾吧。

总览

本次推研计划招收硕士生69人,其中工程硕士(专硕,专业代码:085405软件工程)60人,工学硕士(学硕,专业代码:083500软件工程)9人。按照清华近年来的招生指标硬性规定,在免试推研的生源中来自清华的本科生比例不得大于50%,也即是说,来自清华的本科生最多录取34人。

在最终进行公示的拟录取名单中,一共录取了68人,其中来自清华的本科生34人,来自外校的本科生34人,符合清华生源不多于50%的硬性规定。

分招生专业而言,工程硕士共招收59人,其中25人来自清华,34人来自外校;工学硕士共招收9人,其中9人来自清华,0人来自外校。

软本学生推研数据分析——从录取名单视角

来自清华的34名本科生中,共有30人来自软件学院(含九字班延毕1人、新雅书院分流软件学院1人),2人来自计算机系(含九字班延毕1人),1人来自电子系,1人来自未央书院(未央-水木)。

值得一提的是,计算机系延毕同学是之前从软9分流到计9的同学,其之录取打破了软院“不吃回头草”的传闻(据说软院在推研时会歧视曾经在软院呆过、后来分流去了计算机系的同学,据说曾经有同学被软院以该理由拒绝了)

此外,清本非软院的同学中,仅有1人来自未央书院,说明在软硕录取过程中,并不存在树洞上宣扬的所谓“未央爷抢大类名额”的情况,也不存在“强基爷抢大类名额”的情况。

软本学生数据分析

来自软件学院的30名本科生中,共有27人属于普通录取渠道,1人延毕、在去年通过推迟推研在今年参与推研,1人通过新雅书院进行推荐,1人由于前三年培养方案完成情况存在问题而未获正常推荐名额、后通过3封推荐信进行特批获得推荐名额。

由于3名特殊渠道的同学的GPA不进行统一公示,故以下仅对27名普通渠道方式同学进行分析。

GPA与综合考核成绩相关性分析

众所周知,软院的录取规则为综合考核成绩从高到低依次录取为学硕、专硕(学硕可能不录取外校,这一点待考证),因此学硕、专硕与GPA等指标的相关性可以归为综合考核成绩与GPA等指标的相关性。我简单计算了一下包括GPA在内的各种指标与综合考核成绩的相关性:

import pandas as pd


excel_path = '软硕.xlsx'
sheet_name = 'thss'
df = pd.read_excel(excel_path, sheet_name)

data1 = df['综合考核成绩 ']
data2 = df['GPA']

correlation_coefficient = data1.corr(data2)

print(f"综合考核成绩与GPA相关系数: {correlation_coefficient}")

data2 = df['rank']

correlation_coefficient = data1.corr(data2)

print(f"综合考核成绩与rank相关系数: {correlation_coefficient}")

运行结果为

综合考核成绩与GPA相关系数: 0.7600710659940332
综合考核成绩与rank相关系数: -0.7917385220098156

其中,rank是所有27名同学按照GPA从高到低进行排序得出,取值范围为{1, 2, ..., 27},并不代表该27名同学在软院全体学生中的实际排名。

从计算结果可以得出综合考核成绩与GPA、rank均有很强的相关性

报名直博与硕士录取相关性分析

我根据机试硕士名单不会包含报名直博的同学这一特点,为所有27名同学手动标注是否报名直博,进而研究报名直博与综合考核成绩的相关性。

由于所有报名直博&&报名硕士&&未被直博录取&&被硕士录取的同学均被录取为学硕,因此有足够的理由相信这些同学直博被刷后被录取为学硕是刻意为之,我在此提出一个可能的解释:在直博面试过程中,这些报名直博的软院学生对应的导师还有其他外校的同学报名(可能是老师养鱼,也可能是其他大佬在没有提前联系该老师的情况下临时开冲),然后老师在一番权衡之下决定在直博面试中刷掉原定同学,但又希望能收下这些之前可能已经跟着自己做过一阵科研的学生,于是将其内定为学硕,进而保留其之后硕转博的可能。

剔除这四名报名直博被刷的同学,对剩余23名仅报名软硕的同学进行分析:

import pandas as pd


excel_path = '软硕.xlsx'
sheet_name = 'thss'
df = pd.read_excel(excel_path, sheet_name)

filtered_df = df[df['是否报名直博'] == 0]

data1 = filtered_df['综合考核成绩 ']
data2 = filtered_df['GPA']

correlation_coefficient = data1.corr(data2)

print(f"综合考核成绩与GPA相关系数: {correlation_coefficient}")

data2 = filtered_df['rank']

correlation_coefficient = data1.corr(data2)

print(f"综合考核成绩与rank相关系数: {correlation_coefficient}")

运行结果为

综合考核成绩与GPA相关系数: 0.7863709408000761
综合考核成绩与rank相关系数: -0.8440717125958426

可见相关性相比未剔除报名直博被刷同学的情况提高了。

综合考核成绩与面试房间相关性分析

由于本人在数据科学方面没有多少造诣,只会算相关性,故针对这一部分我的思路是计算各房间最终录取的软院同学的GPA平均值与综合考核成绩平均值之间的相关性,将其与以个体为单位计算的相关性进行比较。如果不同面试房间之间的评分标准是统一的(或者评分是经过正则化的),那么各房间GPA平均值与综合考核成绩平均值之间的相关性应该与以个体为单位的相关性相近,否则说明综合考核成绩具有房间差异。当然,这个计算方法也许并不科学,欢迎读者提出更好思路。

首先不剔除直博被刷同学:

import pandas as pd

excel_path = '软硕.xlsx'
sheet_name = 'thss'
df = pd.read_excel(excel_path, sheet_name)

grouped_data = df.groupby('meeting group')['综合考核成绩 ']
average_scores = grouped_data.mean()

grouped_data = df.groupby('meeting group')['GPA']
average_GPAs = grouped_data.mean()

print(f"各房间综合考核成绩与GPA相关系数:{average_scores.corr(average_GPAs)}")

运行结果:

各房间综合考核成绩与GPA相关系数:-0.24604708268857664

再剔除直博被刷的同学:

import pandas as pd

excel_path = '软硕.xlsx'
sheet_name = 'thss'
df = pd.read_excel(excel_path, sheet_name)

df = df[df['是否报名直博'] == 0]

grouped_data = df.groupby('meeting group')['综合考核成绩 ']
average_scores = grouped_data.mean()

grouped_data = df.groupby('meeting group')['GPA']
average_GPAs = grouped_data.mean()

print(f"各房间综合考核成绩与GPA相关系数:{average_scores.corr(average_GPAs)}")

运行结果:

各房间综合考核成绩与GPA相关系数:0.10794830534272772

可见,不论是否剔除直博被刷同学,以房间为单位的GPA与综合考核成绩的相关性均不如以个人为单位计算的相关性,说明不同面试房间的综合考核成绩给分存在差异

软本学生推研数据分析——从推荐名单视角

根据软件学院推荐免试攻读研究生学生名单公示、软院推研机试硕士名单、软院推研面试硕士名单,所有参与软院硕士考核的软院本科生中,存在GPA的一个阈值,GPA大于该阈值的同学均被录取,GPA小于该阈值的同学均未录取。从这个意义上而言,软院硕士对软院本科生的“综合考核”通过与否也许仅取决于GPA,即使明面上设置了机试、面试。

总结

从录取角度而言,GPA与综合考核成绩相关性接近0.8(剔除直博被刷同学的情况下甚至大于0.8),有足够的理由相信综合考核成绩与GPA强相关,而从推荐名单角度而言,更是呈现了确定的阈值。这对软院本科生的指导意义是显然的——如果想推软硕,卷GPA是绝对的第一选择。

感谢您看到这里,如果您需要本文中使用的数据,请使用edu邮箱联系me@wsssws.site。毕竟原始数据仅公示10个工作日,您需要尽可能表示您的身份来体现获取这些数据的必要性。

写在最后的碎碎念

这篇文章拖拖拉拉,从10月的最后一天连拖半个月,直到16号凌晨才发出来,实在惭愧。最近一直在赶ddl,甚至拖到软硕公示期结束才有空来写这么一篇文章。一方面还好我提前下载了公示名单,没有因为拖ddl到公示结束误事;另一方面忘记下载软博公示名单,没能分析下软博录取情况,倒是一段遗憾。不过也无妨,毕竟博士录取一般走过场,综合考核都是形式,也没啥好分析的。

再来浅聊聊自己吧。不慌不忙的上半年,风云突变的六月,压抑的七月,焦虑的八月,欣喜的九月,惬意的十月,充实的十一月。一波三折造化弄人,最终还是被命运安排到了如今。

小镇做题家的本性使得最初的目标是华子的硕博(? - 2021/?),后来本着对教职的朴素追求想要读博(2021/? - 2022/6),又被树洞劝退土博想要润国外读phd(2022/6 - 2023/1),后来发觉自己的主观能动性确实太差,加上本来也是凡人一个,客观条件已无法支持我润,于是直接追求另一个极端打算直接就业(2023/2),又被hb劝退决定读软硕(2023/2 - 2023/5)。本以为退到如此境地应该十拿九稳板上钉钉,然而羟基计划再一次恶心所有人,各种书院抢名额的消息大行其道,从树洞小道消息到辅导员官方消息使得我不得不开始考虑外推(2023/6)。然而前三年摆烂人连外院外校夏令营门槛都摸不到,在各种碰壁中度过了七月。八月一次下班回学校的路上,被字节hr打了电话问是否秋招,一时难以评价。“那就就业呗”。于是又试着面了一轮字节。毫不意外地一面挂。

终于有了转机。一次偶然中发现软件所是我梦中情所,于是立刻套了相关方向的w老师,w老师看在清本的面子上给了个机会,以阅读论文的方式对我进行考核。这时已经是2023/8/25,我的目标院系有清华深研院人工智能、深研院计算机、软硕,以及外推的中科院软件所w老师。当时我的心理预期是软件所>深研院>软院,可以说软院当时是既不太可能去、又不想去(不想去是因为好坑全占满了)的存在了,而软件所则是既可能去、又很想去的存在。所以当时在清华系统里被深研院二连材料关挂的时候,我一度想直接放弃本校了,直接冲软件所,还能省本校综合考核费100r。

所幸这个时候ytjj带来了一场及时雨,某软0同学因某原因无法完成培养方案要求,无法获得推研名额,从而空出了软院一位与w老师方向相近的h老师的名额。

之前没考虑h老师的原因很复杂,一方面是已经有同学联系他了,另一方面是觉得他的方向跟我想做的也并不完全重合(虽然现在想来,h老师的方向已经是全软院里离我想做的方向最相近的了)。而w老师与h老师也认识,当时w老师还问我为什么不考虑h老师来着。加上当时刚好感冒(ps这场感冒一直拖到10月中旬才好,顶级折磨),论文实在读不下去,害怕w老师因此不给我名额。加上w老师只有直博,我对这件事还是多少有些膈应,于是乎还是决定参与一下软硕,同时给h老师发邮件,大不了100r打水漂。

感冒期间做啥都费劲,机试也没好好准备,第二题打表都打不明白,血亏11.5分。其他题尽力了,只能说每道题都拿了个average吧。

面试的前一天晚上坏消息传来,有4人直博被刷,这4人都要来面硕士,而且毫无疑问都比我竞争力强。

面试。面试顺序按GPA排序,特批名额除外,特批同学一律排在最后。刨掉特批的同学,我是我们那个面试间GPA倒2。实在是想不明白这把怎么赢。

虽然从事后看来,能上是应当的——毕竟未央-软件01的10个人并没有像教务宣称的、树洞传闻的那样来抢名额——大约是都看不上软硕吧。而且其他我本以为很有概率要来的未央-水木02某同学、探微-药0的某同学(你都修软辅了咋推自动化去了呀啊喂 虚晃一枪是吧-_-)都没来,导致GPA比我还低且上了的甚至大有人在,但当时真是觉得这把重在参与,面完回去读论文。

天可怜见,h老师居然就在我面试房间(总共分5个房间面试),而我对面试的准备就是奔着h老师去的。虽然因为人菜,最后几乎要被问穿了,但是再一次天可怜见——铃响了,20分钟到了。

当晚是在焦虑中度过的。树洞一帮狗东西散播焦虑宣称自己接到了软院的电话通知,可我又谁都不认识也不好问,只能无意义地刷手机,越刷越e。终于22.25分,软院的短信来了。几乎是光速登上系统,几乎是光速找到录取信息,几乎是光速确认录取,仿佛是怕软院弄错了,将别人的offer错发给了我,我要是晚一些确认就要被发现然后被收回去,然后就要没书读——只要我确认了,哪怕是发错了,大约也会干脆把这offer给我吧。

冷静下来之后,给w老师打了一篇致歉信,给ytjj打了一段致谢,给所有必要的人报喜。

至于再往后的事,国优计划啥的离现在太近了,而且细节太多了,上面能把入学至今到软硕说清楚已经实属不易(而且还省略了大量细节)。等什么时候值得再像现在这样梳理再说吧。


初めまして、君の名は