第五十零章 国考解密篇之评分探...
国考行测没有官方公布的评分标准以及分值分布,大家都不清楚具体情况。
首先承认,城下君对国考行测具体评分规则也了解的不十分详细,只知道特别复杂,比城下君之前谈到的“个人能力评估”模型更加复杂。但是城下君能指出网上流传的几种评分标准完全错误,同时能肯定一些重要的信息。
——————神奇智能的分割线——————————————————
错误标准一:某公等忽悠考生的评分标准(固定分值)
2010年之前(包括2010年)国家公务员考试行测试卷各部分分值:
(1)言语理解与表达:共40题,每题0点6分,共24分;
(2)数量关系:共20题,每题1分,共20分;
(3)判断推理:共35题,图形推理0点5分,定义判断0点8分,类比推理0点5分,逻辑判断0点8分,共23点5分;
(4)常识判断:共25题,每题0点5分,共计12点5分;
(5)资料分析:共20题,每题1分,共计20分。
2010年之后国家公务员考试行测试卷各部分分值
0点8版的赋分量表
言语理解0点8分/题、40题共32分
资料分析1点0分/题、20题共20分
常识判断0点5分/题、20题共10分
类比推理0点5分/题、10题共5分
演绎推理0点8分/题、10题共8分
图形推断0点6分/题、10题共6分
定义判断0点7分/题、10题共7分
数量关系0点8分/题、15题共12分
0点6版的赋分量表
言语理解每题0点6分、40题共24分
数量关系每题1分、20题共20分
图形推理每题0点5分、10题共5分
定义判断每题0点8分、10题共8分
类比推理每题0点5分、5题共2点5分
逻辑判断每题0点8分、10题共8分
资料分析每题1分、20题共20分
常识判断每题0点5分、25题共12点5分
【究竟是0点8还是0点6量表,看常识判断部分是20道题目还是25道题目,20道是0点8版,25道是0点6版】
——————神奇智能的分割线——————————————————
PS:还有好多同类的固定分值评分标准,其方式就是筹够100分。这种思路从一开始就是错的,主要是受早期一些地方省市公布的固定分值影响。
某公瞎凑半天,终于整出一套能到处忽悠考生的分值分布了,据说还是根据具体的分数值进行推算得出的,不知道科学性何在。
——————神奇智能的分割线——————————————————
错误标准二:分区段分值
1~40题,0点5×40=20分
41~45题,0点7×5=3点5分
46~60题,1×15=15分
61~65题,0点8×5=4分
66~75题,0点5×10=5分
76~100题,0点8×25=20分
101~125题,0点5×25=12点5分
126~145题,1×20=20分
PS:这种分值方式完全是省事、瞎玩,别当真。
——————神奇智能的分割线——————————————————
另外一些说法:看参加此次考试考生的整体成绩,按照部分加权得分,所以较难的部分你答对了分值就高。
PS:按部分加权得分,指各部分每题的基础分都一样,再根据作答比例加权分值。
——————神奇智能的分割线——————————————————
穿插内容:国考评分工作中的重要信息——在行测答题卡扫描过程中,行测标答信息始终处于保密状态,行测评分将由软件系统自动完成。
PS:“行测评分是由软件系统自动完成的”,我们能通过这句话推理出以下两个重要信息:
(1)不是固定分值
假若是固定分值,就不叫“软件系统”了,固定分值统计分数太简单了,根本配不上“系统”二字,因为“系统”代表着庞大复杂!
(2)必然有一套数据模型支撑
没有“数据模型”是算不出复杂分值的,只有“数据模型”才能与“软件系统”搭配,据说非常复杂,人事处的处长都一时半会儿解释不清楚。
(3)“自动”表明完全没人啥事,这个“系统”已经非常复杂先进了。
可以肯定的是,谢小庆必然参与这个复杂“系统”的模型建设,城下君翻过他的相关人才测评论文,那些公式没有一个看得懂的。
**丝就是**丝呀!
——————神奇智能的分割线——————————————————
如何理解国考行测的分值分布?首先需要明白国考的现状——淘汰绝大部分考生!数量高达百万。
那么怎样才能把绝大部分人淘汰了?必须将少部分高分考生凸出来!
那么行测最后的分数必然只有一小部分高分领先剩下的大部分考生,即评出来的高分考生之数量非常有限!
为了达到这个目的,“软件系统”评完分之后的分数汇总将呈现出标准的“正态分布”——高分考生和低分考生都比较少,大部分人都是中间分数(两头低,中间高)。
而要达到“正态分布”就必须不停地给每一道试题赋值!
——————神奇智能的分割线——————————————————
那么我们可以猜测国考行测每1道题都是一视同仁的(因为每一道题的功能都是一样的,区分50%的考生),各种类型试题的权重早就在其考查的数量上体现出来了,比如言语理解40道,数量关系15道,毋须再从基础分值上区分(基础分值指不同类型的题赋值起点不同,如数学运算1分起,言语理解0点8分起)。
如果你再仔细思考一番,考查言语理解能力(言语40道题)、逻辑推理能力(判断40道)、分析推理能力(数学运算15+资料分析20=35题),这主要的三种能力考查题量几乎一样,同等重要,不需要再从基础分值上区分了。
机器一开始统计出来的是每道题的答对率(正确率),根据这个正确率赋不同区间的值。
比如60%的正确率赋值空间在0点6到0点8之间,40%的正确率在0点8到1点0之间。
每一个正确率必然对应一个赋值区间(试题的分值在这个区间选取),通过不同赋值体系的选择,最接近“正态分布”的为选用方案。
比如一套试卷有A、B、C这3道题,每题的正确率分别为60%、50%、40%,其赋值空间依次为60%(0点5至0点7)、50%(0点7至0点9)、40%(0点9至1点1),
第1套赋值体系:A题0点5分,B题0点7分,C题1点1分,
第2套赋值体系:A题0点6分,B题0点8分,C题1分,
第3套赋值体系:A题0点7分,B题0点9分,C题0点9分,
第N套赋值体系:……
每一套赋值体系下所有的试题的总分都为100分,或者非常接近100分,每一题的赋值分值可能约分到百分位或千分位。
——————神奇智能的分割线——————————————————
我们确定下评分程序:
(1)机器扫描答题卡,根据标答(标准答案)确定每位考生每道试题的答对与否;
(竟然还有人认为行测可能有多个答案正确,包括大机构的老师,奇葩啊!真不是一般地挫呀,没看到试题说明里面的“请选择最正确的一项”吗?连“最正确”的含义都理解不了。
还有人称如果大部分考生都选某一个答案,那么这道题就可能改成这个答案或者这个选项也对,这种说法完全是以自我为中心,自己给自己打安慰剂,城下君说的比较委婉,其实就是那两个字YY。)
(2)系统统计每题的正确率,根据正确率确定每题的赋值区间;
(3)在赋值区间内,带入一套赋值体系,这套赋值体系里每题分值确定;
(4)根据这套赋值体系统计出每位考生的分数(还包括其他各种参数带入);
(5)系统汇总这些分数,根据分数分布画出一条曲线;
(6)系统会重复上面的程序几十次,最终画出几十条曲线;
(7)选取最接近“正态分布”的那条曲线所带入的赋值体系,最终确定各位考生的分数和排名。
——————神奇智能的分割线——————————————————
也就是说选取所有考生的分数汇总后最接近“正态分布”的那套赋值体系为当年的分值分布。
这套“软件系统”不停地自行带入不同的赋值体系,画出百万考生成绩分布图,自己比较分析,选取最接近“正态分布”的那套。
赋值原则差不多这样,当然不要忽略好多其他因素影响,数据模型都是这般复杂的,会输入各种你意想不到的参数。
——————神奇智能的分割线——————————————————
行测每一道题的地位都是平等的,命题人希望每一道题都只有或接近50%的正确率,在考察意义和目的上,各题之间没有区别。
国考以往140道题,现在为135道,2000年还是130道题,采用无差别对待,在软件里设置几个要求,比如分值相加满分为100左右,正确率低的分值比正确率高的分值多之类的,再加上所有考生成绩汇总最接近“正态分布”等,就大概可以了。
也就是说不必计较分值多少,只管保证正确率就行。
注:国考和省考的分值体系不同,请勿套用!
——————神奇智能的分割线——————————————————
前面提到了某图的分值体系:“公务员不公布题目、不公布解析、不公布答案也不公布每道题多少分,某图教育的基础研发部门通过考生数据的建模反推出来了这些不公布的内容。”
首先,某图不是“通过考生数据的建模反推”,它们其实是派135个或者更多的傻帽员工去考试,按题序,每人只做1道题,再根据每人的考分确定每题分值。
当然也有傻帽连1题也做不对,那就是零分,某图再人工瞎估这些试题的分值。
其次,某图整出来的这套分值分布都是去年的赋值体系,用去年的分值估算今年的考卷分数,根本没有意义。
比如,去年第5题大部分人都做对,系统只给了0点5分,今年这题只有少部分人做对,系统给了1点1分,某图就用去年的0点5分计算这个原本1点1分的试题。
最后,某图的估分精准之说大部分都是自己吹嘘的,极少部分是瞎猫碰上死耗子。
——————神奇智能的分割线——————————————————
本期加餐:申论评阅科学性问题
针对考生比较关心的申论评阅科学性问题,负责人员介绍,命题和阅卷核心专家会在考生中抽取2000份答卷,以研究和修订标准,并形成60份好、中、差的标杆卷。
阅卷员抽取2万—5万份考卷进行严格的模拟评分培训以统一评分尺度。
正式的申论评分工作实行双评以上误差控制规则,由两名阅卷员在互不知对方身份、评分特点的情况下进行独立打分。
同时,双方打分结果超出误差范围则有第三个阅卷员参与评分,取三人较小差异平均分;若三人打分仍超出误差范围,则交由阅卷核心专家裁定。
PS:命题专家和阅卷核心专家才是掌握申论阅卷标准的人,普通的阅卷员只是充当机器而已。
——————神奇智能的分割线——————————————————
再次强调,本篇内容仅为探讨,还有很多其他因素没有考虑进来,但“正态分布”之说确实是正确的。写这篇内容主要是为了拆穿某公的纯忽悠、揭示某图的纯傻叉行为。