乐嘉小说
会员书架
首页 > >公考笔记 > 第四十三章 在线教育篇之袁题库...

第四十三章 在线教育篇之袁题库...

上一章 章节目录 加入书签 下一章

本章涉及较多互联网专业知识,有些难懂,虽然城下君会尽量叙述的通俗易懂,但还要请各位做好心理准备。

袁题库最引以为傲、吹的神乎其神的便是“智能题库”及“大数据”,在这一章里,城下君就好好探讨袁题库的“智能题库”及“大数据”。

一、什么是“智能题库”

按照袁题库的说法,“智能题库”指通过对行测真题所涉考点的反向研究,将所有行测题目横向划分了考点类别、纵向划分了考试难度,参照项目反应理论和等级反应模型,综合考点考频和考题难度,利用人工智能算法,实现针对个人的能力评估和智能出题。

看不懂吧?很正常,所谓“智能”就是指“计算机根据个人情况出题,选出最适合考生的题目”。

——————神奇的分割线——————————————————

二、试题属性标签

“智能题库”需要给每道试题“贴标签”,标签包括难度、考点和考频——这是袁题库最核心最关键的功能,机器算法可以根据不同的标签将题目推送给不同的考生,达到因材施教的效果。

第一属性——考点

考点必须人工添加,并且分类合理到位,因为计算机一般只能支持5个层级,所以知识点一般也只能分到5层。

举例说明:

行测(第1层,申论与之并列)——真题(第2层,还有模拟题与之并列)——言语理解与表达(第3层)——逻辑填空(第4层)——实词(第5层)。

目前所有的题库最多只分到实词这一层,在实词的基础上根据你所选择的考试确定实词的考查频率(这里当然是100%),再给你推荐一道难度相仿的试题。

这就是袁题库所谓的试题精准推荐,最多只能给你推荐实词类试题中同难度的试题。

请问这种推荐有多大意义?相同难度的实词题可能解法不同,比如,有的从感**彩入手,有的从搭配上区分,还有的从基本词义区分。

考生做错一道题是因为没有把握住题干的感**彩,结果袁题库给你推荐的是同难度的强调搭配的题目,请问这就是“精准推送”吗?

我们完全可以编一本题库类型的书,把试题按照同一细分考点下难度由简到难排列(如实词类从简到难),就能达到袁题库所谓的“精准推荐”!

——————神奇的分割线——————————————————

第二属性——难度

袁题库每道试题的难度划分为9级,别想了,人工是不能把试题划分为9级的,因为你根本感觉不到8级难度和9级难度的区别,人工最多只能感觉到“简单、中等、难、极难”四个层级之间的不同。

那么袁题库是怎么添加9级难度标签的了?通过程序,根据用户的练习数据赋予题目1-9档难度系数。

比如某题只有9%的正确率,那么就是9级难度;90%的考生都做对了,那么就是1级难度。

通过机器判定试题难度,方法选择确实很正确,不仅能减少人工工作量,还能避免个人的主观偏差。

——————神奇的分割线——————————————————

第三属性——考频

考频指考点历年的考查频率,这个考频依旧不是人工添加的,用机器区分反而更合理。

比如你选择参加国考,那么机器会统计近3年或近5年国考试题的考点分布,统计每个考点的考查次数,以近5年为例,有4年考到,那么这个考点的考频就是80%,或者说四星。

考频如果考虑试题的考查次数,会更加复杂,比如统计近5年实词类和成语类试题的考查次数,发现实词类有70次考到,成语类只有35次,那么实词类试题的推荐题数就应该是成语类的2倍左右。

考频越高,机器给你推荐的此类试题就越多,如果近5年都没有考,那么就不会给你推荐此类试题。

加入考频标签,对行测有一定好处,也有一定误差,因为每年的考点具有随机性和固定性,一部分考点必考,有些考点随机考,随机考的考点就不好办了。

具体到行测,考频必须考虑试题的考查次数,因为很多考点都是100%考查的。

————————————分割线————————————————————

除了考点、考频、难度三大属性外,每道试题还需要添加什么标签更加准确合理了?对了,还得有“解题方法”和“作答时间”!

只有加上“解题方法”才能真正意义上做到“精准推荐”,否则一切“智能算法”都是扯淡。

同时,“解题方法”还有“或”与“且”的关系,有的题目必须多种方法并举才能解题。

至于时间因素,可由机器代劳。根据对单个试题每位考生的作答时间统计,去掉2分钟以外、5秒以内的数据,算出平均值,就可以当作该题的平均作答时间。

如果考生同考点下有50%的试题作答时间没有达到平均时间,那么依旧判定考生对该考点掌握不牢,仍然需要强化训练。

“解题方法”和“作答时间”两大属性,袁题库都没有统计在内,故而不可能做到“精准推送”。

袁题库只是统计考生所有试题的平均作答时间,参考这个时间来计算考生的预测分。

——————神奇的分割线——————————————————

三、试题智能推送

前面已经讲过,试题的智能推送,袁题库只能做到目前主流的分类层次,比如言语只能分到实词、数学运算只能分到工程问题。如果只分到这一层级是无法做到智能推送的。

何况,袁题库还有一些重复录入的试题,各种因素导致这个功能有不小的缺陷。但是袁题库在开做之前工作没有做到位,除非推倒重做,故而改进的可能性非常小。

——————神奇的分割线——————————————————

四、个人能力评估

个人能力评估其实是整个“智能题库”最为核心和复杂的部分,因为“智能出题”需要根据能力评估的结果推送,而评估结果的准确是建立在试题标签添加的合理到位之上。

个人能力评估的复杂性远超各位想象,简单来说,涉及以下因素:练习题量、作答正确率、考点考频、答题时间、难度系数、解题方法、知识点汇总。

如果想做好能力评估工作,需要将这些因素构建一个非常复杂的数据模型。下面我们来探讨一番,注意仅为探讨!

第一因素——正确率

作答正确率是能力评估环节最重要的因素,其它因素都是在正确率上加权。

这个正确率我们先只算最小知识点的平均正确率,比如我们现在只考虑实词部分作答试题的正确率。

后面再考虑由实词、成语、虚词、实词成语混搭等的评估值(正确率加权)汇总成逻辑填空部分的评估值(正确率加权)。

第二因素——难度系数

难度系数是正确率的一个重要加权。以袁题库的9级难度为例,设定5级难度系数为1,那么有:

1级—4级难度系数依次为:0点90/0点93/0点96/0点98/0点99

6级—9级难度系数依次为:1点01/1点02/1点04/1点07/1点1

也就是说做对1道难度为9的试题,加权将达到1点1,而做对一道难度为1的试题,加权仅为0点90(如果你做的全是难度为1的试题,你的评估值将仅为正确率的90%)。

知道每级难度的加权参数,再接着汇总:

(1级难度试题的正确率X0点90+2级难度试题的正确率X0点93+……+9级难度试题的正确率X1点1)除以9就是某一细分知识点正确率加入难度系数之后的评估值。

第三因素——练习题量

只有做题达到一定数量,才能给出相当可靠的能力评估。那么这个数量是多少了?以平均每个知识点10道题来计算,需要作答大约1500道左右。

做的题越多,能力评估越准确,相反,只做一二百道题的能力评估是没有意义的。

能力评估最科学合理的还是从单个细分知识点开始计算,比如实词部分考生做了1道题,那么就判定实词部分的“练习题量加权系数”为0点990,做了2道是0点991,……,做了10道及超过10道都是0点999。

是的,练习题量系数是做减法的,并且永远达不到1。

第四因素——答题时间

行测对作答速度的要求非常高,因而衡量个人能力,不能不加入时间参数。

时间参数的设置还是从最细小的知识点算起,比如实词部分所有考生的平均作答时间为50S,某一考生的平均作答时间却为55S,那么判断这位考生在实词部分上的掌握能力必然要乘以一个小于1的参数,反之,则乘以大于1的参数。

具体参数数值,太复杂了,省去不谈。

第五因素——考点考频

考点考频因素指加入知识点考频参数,这个参数比较复杂,需要准确分析每个细分知识点的考查次数。

举例说明,近五年国考逻辑填空考了100道题,其中实词考了30道,成语20道,实词成语混搭50道,那么实词、成语、实词成语混搭3种知识点在逻辑填空部分汇总时所占的权重将不同。

具体到数据,30道实词汇总逻辑填空评估值时X系数0点98,20道成语X0点97,50道混搭X1点2。

第六因素——知识点汇总

知识点汇总只细分考点一层层汇总,每一层都需要根据所占比重给予不同加权系数。

真难解释,还是举例说明吧。

在细分知识点这个层级,需要汇总一个评估值,以实词为例讲解汇总过程。

得出实词知识点评估值,需要做以下工作:

正确率X难度系数加权X练习题量加权X答题时间加权=实词评估值

实词评估值X实词考频加权+成语评估值X成语考频加权+实词成语混搭评估值X实词成语混搭考频加权=逻辑填空评估值

逻辑填空评估值X逻辑填空考频加权+片段阅读评估值X片段阅读考频加权=言语理解与表达评估值

以此类推,最终得出行测的评估值,这个评估值就是你的个人能力评估

——————神奇的分割线——————————————————

哈哈,各位是否看蒙了?有几个头脑还清醒?如果你能看懂,那么城下君告诉你这还只是一个初步模型……

除了前面的六大因素外,还有其它因素影响个人能力评估。

其它因素一——解题方法

假设每道题都添加了解题方法这一标签,那么个人能力评估还可以看出每个人对具体解题方法掌握的强弱,真正意义上做到给每位考生精准推送。

现在的个人能力评估只能告诉你哪个知识点掌握的不够,不能告诉你怎么增强这部分知识点。分析的还不够透彻,现实意义不大。

其它因素二——横向对比

前面只是纵向分析,这个数据模型还得加入横向因素。

所谓横向因素指具体到一道题上,如果大部分人都做对就你没做对,那在评估你这个知识点时应该多减一些数值,反之,则多增加数值;还须根据考生在同一个知识点上的综合排名情况(正确率、作答时间等)来确定不同的参数,排名越靠前,评估该知识点掌握情况的参数越高,反之,则越低……

这里依旧还是……

——————神奇的分割线——————————————————

讲到这里,即使考虑这么多因素,这个个人能力评估依旧是个“初步的数据模型”,袁题库的这个模型还远比城下君考虑的要“粗糙”。

事实上,整这个数据模型需要复杂数据分析专家、数据算法专家、教育测量专家,等等。而这些人员配备,袁题库都没有。

写这么多,费这么大劲,就是想说明袁题库“个人能力评估”的准确评估个人能力之说依旧是个嘘头。

另外一个问题,关于“大数据”。“大数据”几乎是目前最火的概念,但是我国的数据量还不能支撑“大数据”分析,整个世界范围内,也只是初步研究“大数据”,何来运用?袁题库强调依靠“大数据”,还是为了和时下最火的话题搭上边。

你可以这样理解,但凡扯到“大数据”的都是瞎扯。

点击切换 [繁体版]    [简体版]
上一章 章节目录 加入书签 下一章