教育+大数据,核心在于采集和设计

2015-08-31


       好老师和普通老师的区别到底在哪里?也许运气比较好的你,遇到过这样的老师,他们的课堂坐无缺席,无论怎样的学生,只要他们一教,定能提分。这些都会被总结为一个词,叫做“经验”,有经验的老师就像个老中医,一把脉便知道你的弱项,给出针对性的解决方案.


       而科技遇上教育,我们便在想,这个虚幻的“经验”,是不是可以在算法和数据的世界里变成确切的程序和关联。而大数据遇上学习,是不是可以让我们看清楚学习动机、学习过程以及学习效果的来龙去脉。考满分的创始人刘庆逊在讨论中表示,希望通过数据采集和数据挖掘,像西医一样,拍个X光片,诊断学生的问题,药到病除。


       教育+大数据,可能第一个热点关联词就是“自适应学习”(adaptive learning)。什么是自适应?简单来说,通过收集学生数据,基于知识图谱,用算法匹配到最适合某个学生的学习内容、方法和路径。要做好自适应,那就涉及到第一收集哪些有意义的学生数据以及是否能收集到,第二知识图谱的建立以及知识颗粒的切分,第三算法匹配逻辑。


       而除了自适应学习的智能系统外,大数据之于学习的意义还在于学习分析(Learning Analytics)。通过挖掘各类学习、行为以及背景数据,找到学习效果和各个因素的关联,加强我们对于学习的理解。而这种关联和理解,能帮助我们预测学习行为,以修正教育体系和政策。乂学教育的王枫说,大数据即使不是自适应,那些海量数据的学习分析报告也非常有用。


       “大”数据,第一步是找到采集


        大数据需要一个量的累计。拓欣菁优的杨栋表示,就目前来说采集K12学生的海量数据并非易事,可能需要某种技术上的突破才能真正采集到大数据。为什么不容易采集到学习的大数据呢?第一、学校作业基本还是在纸上完成,并没有被电子化。第二,虽然有许多学习app,但是大多数家长并不允许孩子们长时间地使用移动设备。第三、能够被采集到的考试数据,其实只是学生学习中的单点,而不是线。一件事情如果不连续,那么数据就是被扭曲的。而要拿到学生数据,可能会是在智能硬件上的突破。


       而babycan的万鹏也讲到,在幼教市场,数据的来源有两个:一是幼儿园,二是家长。幼儿园较为保守,很难攻克。而家长是比较愿意记录宝宝的数据,但是采集成本也很高,需要家长主动记录宝宝的成长或者回答问卷中的问题。而智能硬件的产生可能会使得采集数据的过程更为流畅和易于发生。


       怎样利用好已经获取的数据更重要


       其实除了学习数据,对于学习有影响的还包括行为数据、性格数据、以及学生的背景信息等等。比如一个学生是否学得好,除了他的答题和作业,也许还和他的家庭背景,是不是和辅导员经常交流,甚至和他住在哪间寝室都有关。而超人学院的吴超说,他们除了分析学习数据,还会通过性格数据、行为习惯来预测学生的学习。


       而从另一个角度来说,有时候我们有了大数据,却用不起来。这就和最开始的设计有关。乂学教育的王枫说数据一定要有目的的去采集。如果没有目的的收集了各种数据,并不能对我们的研究或者实践有任何指导作用。所以要做好学习分析,需要基于研究证实的数据分析框架,并且不断试验和迭代。


       大数据+教育,带给我们许多想象,而更进一步也需要我们对数据采取更开放的态度。独立信息设计师郭瑽表示,由于大家都觉得数据是块金矿就保护起来,所以人为造成很多数据孤岛。而数据集之间的交叉分析能产生更多有意义的结论。