北京正山段福惠律师
新浪微博
微信

人工智能教育应用理论框架:学习者与教育资源对称性假设——访智能导学系统专家胡祥恩教授

| 全文共11585字,建议阅读时23分钟 |


本文由《开放教育研究》杂志授权发布

作者:本刊特约记者 刘凯 胡静



♬ 点上方绿标可收听音频

编者按

 

胡祥恩教授是美国孟菲斯大学心理学系、电子计算机工程系、计算机科学系教授,智能系统研究院高级研究员,美国先进分布式学习孟菲斯实验室主任,华中师范大学心理学院院长、中国青少年网络心理与行为教育部重点实验室高级研究员,研究领域包括数学心理学、实验设计与统计、心理学、人工智能和智能导学系统。本文系2018年7月华中师范大学举办的“教育大科学前沿论坛(第三期)一中国通用人工智能高端论坛”会议期间对胡祥恩教授访谈基础上整理而成的。

作为一种新技术,人工智能已经成为教育学界讨论的焦点。然而,技术面对的不仅是理论,更关键的是应用问题,怎样才能充分发挥人工智能技术的优势使之真正融入教育,避免因过度包装而产生的空洞陷阱,是一个需要解决的问题。对此,胡祥恩教授认为,我们需要从观念上进行根本性革新。他提出一种人工智能教育应用的新理论框架:学习者与教育资源对称性假设,即学习者能够在与教育资源(教学内容、学习环境、互动机制和学习过程)的互动中实现知识结构的最优化,同时教育资源也能够在这一互动中得以改进。该理论框架以全新的视角审视学习者和教育资源的关系,认为教育资源并非被动、僵化、静态地参与教学过程,而是在动态、适应性地进行自我改进。在这一理论框架的支撑下,人工智能技术与教育资源有机结合,“个性化”与“拟人化”合为一体,令呆板、枯燥的在线学习系统被有效激活,从而极大地改善系统的教学效果。因此,该框架不论在理论还是在实践层面,都具有重要的学术和应用价值。

关键词:人工智能;教育;教育资源;学习者;对称性假设;理论框架


记者:胡教授,当前人工智能技术与教育结合日益紧密,您又有教育学、心理学和计算机科学等多学科背景,您能否根据您的自身感受谈谈您对三者关系的理解?

 

胡祥恩教授:这三个学科都有自己的研究对象、方法和应用领域,但他们共同的交集是学习科学。教育学、心理学和计算机科学皆与学习有关,从不同角度为学习科学做出了重要贡献,我的工作便聚焦于此。心理学最重要的一个研究领域是认知心理学。认知心理学的主要研究对象是人的记忆和学习等高级心理行为,所以心理学与教育学密切相关。具体来讲,影响学习效果的因素很多,人的学习研究也有很多理论,可以作为指导学习活动的基本原理,这个过程就涉及教育应用。举例来说,美国教育科学研究所曾总结过一些基本学习原理,第一条便是“Space Learning Over Time”(Pashler et al.,2007)。比如,学习统计学,每星期学2小时,一学期15周,共30学时。有人说那还不好办,一两天不睡觉就能拿下,我想肯定有人这么试过,但肯定不会成功。如果两三天不睡觉就可以把统计学学好,那学习只需要毅力就可以了,这是不现实的。因为学习和教育行为必须建立在个体认知的基础上,不能违背基本的心理学原理。

 

心理学家可能会做得更细致严谨,且必须有实验数据支持。教育研究者不会提出人们完全没有听过的原则或理论,心理学家却能揭示一些与直观经验相违背的发现,比如有人认为计算机辅助学习效果好,学生做完题目后马上就能告知对与错,即反馈迅速。原来考试结束两三天后老师才能把卷子批好发给学生,现在计算机眨眼间就能阅完试卷报告成绩了。但是,过去学生考完后会有自我反省或跟同学讨论的过程,在揭晓成绩前,考题大都还记得比较清楚。现在是,试卷一提交成绩马上出来,然后学生就开始干其他事了,谁还记得没做过、做对却有疑问的试题?这样的考试对学习好不好?这需要证据说话,所以有些东西需要用实验验证。

 

研究教育和研究学习不一样,研究学习跟做培训又不一样。先看前一个问题。研究教育不需要必然达到这个层次,比如两个变量间存在什么关系,一个变量对另一个变量有何影响,学习后要不要参加考试,考试的频率多少最合适,课后老师帮助复习还是学习者自己复习更好,提问的深度如何等?因为这些问题已经不是纯粹的教育学问题,而是跨入认知心理学的范畴了;再看后一个问题,培训和学习的原理又不一样,比如技能的培训和系统的学习,所用的方法和程序都不一样。比如,要训练腿部肌肉,我可以选择某套设备;要训练胸部肌肉,我就做俯卧撑。这与培训的原理一致,即要训练某方面的能力,应问相应类型的问题。美国教育研究者曾总结了16个不同的问题,并分成三类:一是简单的问题,学生只要看书记住就能回答;二是学生看了书,如果不理解则未必能回答;三是学生看了书,如果不理解,肯定回答不出。教学实践中,用问答的方式引导和帮助学生的做法涉及两个理论范畴,包括学生怎么学和教师怎么教。我在华中师范大学的学生就做这方面的研究,把慕课老师的提问记录下来,然后分类统计第一类问题、第二类问题和第三类问题的数量和频率,进而评估该课程的效果,探讨老师提问的方式和学生学习效果之间的关系。你留心观察也会发现,老师提问的方式是很不一样的。你把某门课程最好和一般的教科书做比较也会发现,二者在各章节后提问的方式是有差别的。教师们大多知道,出考题其实并不容易,为什么?因为把要点考出来其实就是向自己提问,这里面包含认知心理学关于学习的基本原理。《人类是如何学习的》(How people learn)这本书是关于人如何学习的,在美国非常畅销,刚出了第二版(2018版)。我建议教师尤其是从事学习理论与学习技术工作的教师要读一读。

 

记者:毋庸置疑,人工智能已成为教育学界理论探索和实践应用的热点。美国人工智能技术应用方面有没有相关经验可以为我国教育同仁借鉴?

 

胡祥恩教授:在教育技术领域,不论是计算设备还是计算系统,计算的教育化都是极为重要的。其实在计算机出现后,大家就开始做这件事了,但是非常难。美国国家工程研究院(NAE)自2008年起,定期召开全球重大挑战峰会(Global Grand Challenges Summit),评选本世纪最难的问题。综合起来,这样的难题大概有14个,其中之一便是“先进的个性化学习”(Advance Personalized Learning)①。虽然这距今已整10年,但一直被认为是本世纪最难的工程技术问题之一。这个问题难到什么程度呢?在这14个难题里,还包含大脑逆向工程这样的问题。也就是说,从工程上看,要设计出先进的个性化学习系统,其难度与新造大脑同属一层次。可以说,技术越先进,或者说对人的学习了解越多,挑战越大。

 

大家可能知道鼎鼎大名的布鲁姆两个标准差结论。1984年,教育心理学家本杰明•布鲁姆(Benjamin Bloom)设计了一个实验:把同一班级的学生分成两组:控制组和实验组。实验组由最好的老师给他们做家教,控制组的学生学习方式不变。结果发现,如果老师给学生做家教,中等程度的学生可以变成尖子生,成绩提高了两个标准差(Bloom,1984)。这意味着普通学生接受家教后可以考到八九十分。这是个很有价值的发现,但这是人类教师对学生教育的结果。如果将人类教师换成不知疲倦的智能教师进行家教,效果如何?遗憾的是,到目前为止,技术水平尽管进步很大,但计算机教学系统对学生的帮助依然不能取得两个标准差的效果。所以,教育技术的研究者就把两个标准差的学习变化作为努力目标。我们期望机器可以像人一样达到两个甚至更大的标准差的教学效果。要说明的是,这是单纯从学习效果看的。除学习效果外,其他人类教师能实现的,譬如和学生情感交流、关怀等,智能机器人尚未能实现。

 

记者:既然家教可以让中等学生变成尖子生,同时人工智能技术也取得了突飞猛进的发展,为什么我们不能开发达到或者接近人类教师的智能家教?是技术上不能实现,还是存在其他障碍?

 

胡祥恩教授:很难说,之所以没实现,我的认识是因为研究缺乏好的理论指导。比如,今年伦敦举办的学习节(Festival of Learning)大会上②,全世界优秀的教育技术工作者齐聚伦敦大学学院。大会由三个子会议构成,其中之一便是教育中的人工智能(Artificial Intelligencein Education,简称AIED),这个分会2017年是由我主持的。它有个特点,就是大家都在谈论人工智能教育,没有一人像AI研究者一样谈AI,大都是讨论计算机在教育领域的巧妙应用。这种应用产生出很多高水平的重复,但不容易有大的突破,为什么呢?原因就是缺乏理论指导思想。虽然智慧教育、AI等词汇看着诱人,但把它们落地却没有人将AI当作框架去实施,只是说某软件有何种功能、可以解决哪些问题。有专家曾专门调侃指出,在不知道之前它是智慧教育,知道后就是计算机科学了。我认为这是不对的,亟需反思和重塑。其实我们不是没有技术,也不是没有教育基础,问题是如何有效地把技术与教育结合起来,这是教育技术学最核心的理论问题。对人工智能技术而言更是如此,若想将人工智能纳入教育,就应该有一套针对教育环境的适应性理论框架和基本假设。

 

记者:这套适应性理论框架和基本假设是什么?

 

胡祥恩教授:这套适应性理论框架的核心是两个假设:第一个假设面向的是学习者,即任何学习者都存在最佳的教育环境(包括教育资源、学习环境、互动机制和学习过程),学习者可在这个教育环境中实现知识结构的最优化;第二个假设面向教育资源,即教育资源能够在教育环境下通过与学习者的互动得以改进。其中一点非常值得关注:学习者知识结构的改变和教育环境中某些教育资源的改变,二者因互动而改变的规律具有某种对称性。对于这两个假设,第一个比较容易理解,第二个比较难懂。理论上说,不论是大家熟悉的数字资源(如在线授课及测试系统等网络学习环境),还是教室、教具、教师这样的非数字资源都能通过与学习者的互动得到改进。然而,数字和非数字教育资源改进的规律不同,改进的速度不同,改进的效率和效果也不相同。100年前没有阶梯教室,古代连班级都没有,现在有的班级40多人,有的100多人,教室里还增添了投影、电子白板等。这说明教育资源也在改进,只是改进的方式和规律跟学习者不一样而已。总体来看,教育资源的改进大体是人和技术共同作用的结果。值得注意的是,数字资源的进步和改善的速度特别快,成本也比非数字资源低,在经济和工程化上都比较可行。当前的重点必然是数字资源,毕竟不是所有的教育资源都是同等重要的。因此,我们应该在教育实践中致力于创造让数字资源可改变的机会,而这一改变最佳的推动器正是人工智能技术。

 

记者:您刚才提到的“对称性”很有意思,能否详细解释一下?

 

胡祥恩教授:先看个简单的例子。以做练习题为例,传统的纸张属非数字资源,而现代的考试系统及数据属数字资源,试题信息在交互中得以改进的效果一定比纸张更直接和有效。如果我们同时做10道难度不同的题目,你做对的是10道题中最难的3道,却不小心把7道简单的题目做错了,而我把所有容易的题目做对了,但3道难题都不会,我的成绩就不如你。你比我学得好,但没我细心。试题有难易差别,学习者能力有高低之分,统一在一个相互依赖的系统里,学习者能力的高低体现在答题对错中,题目的难易差别体现在学习者的成功与失败中,这就是一种“静态”的对称。这种对称特点恰是经典的教育测量理论的精髓。经典的教育测量理论考虑这样的问题:给定N个学生做M道题目,能否通过学生做题的结果(对错)将学生的相对水平和题目的相对难度同时求解出来?著名的Rasch模型要解决的就是这个问题。在Rasch模型里,学习者的知识水平和题目的难度是两套参数,这两套参数在数学上是对称的。在这个意义上,学习者和与学习者进行互动的教育资源(题目)是对称的。现在我把这一对称性加以扩展:一是假设学生在学习环境中学习(改变知识结构);二是假设与学生互动的教育资源也像学生一样“改进”。于是,这个“对称”性就具有新的含义了:学习者与教育资源,相对于学习环境和过程有了新的对称意义。已有的研究和实践中,这一对称性是存在的,比如将第二个假设的教育资源替换成教师(教育环境中的人力资源),肯定没有问题。但如果把教育资源换成“数字资源”(譬如智能家教系统),那么我们对这些数字资源的要求就不一样了。我们需要赋予它们像教育环境中人力资源(教师)一样“智能化”。在这种理论的指导下才有可能像研究人工智能(和开发)那样去研究智慧教育。然而截至目前,教育人工智能(AIED)的会议报告中,基本上没有论文把教育资源当作人一样对待。他们没有真正把人工智能以及智能理论放置于这个整体研究的框架中。事实上,离开这一理论框架的支撑,他们也很难放得进去。把教育资源当作人一样对待,过去我们只能想却做不到,因为人是有记忆的,教育资源没有记忆,而且很难让教育资源有记忆。现在不一样,我们有教育大数据,不仅可以将所有学习者的学习行为记录下来,还能把所有的教育资源跟学习者的互动记录下来,之前实现不了的任务现在都能做到。今年夏天我们组织了全世界二十几位顶级专家专门讨论了这一问题,迄今没有人或者说还没有人开始研究,真正地推进教育资源的自我改进。教育资源的自我改进,尤其是对称性假设下的自我改进研究和应用,目前是崭新的课题。从前面的分析也可以看出,人的观念而非技术才是关键,大家从没有想过把教育资源当作人一样看待。学习者追求的是在某种优化的学习环境中学习,学习者在学习中改变自身的知识结构,教育资源也在学习者的学习中不断被完善。所以,伴随着学习者的进步,教育资源也会相应改善,教育研究也会进步,教育的整体水平也会不断攀升。在对称性假设下,必定要考虑教育资源的自我修复与自我完善。于是,在当前教育和技术发展的大背景下,应该重新审视人工智能与教育结合的新思路了。

 

记者:这一理论框架非常深刻,有具体实现的路径吗?就是说,如果按照您提出的这一框架进行研究与开发,该如何实施呢?

 

胡祥恩教授:这一框架是我最近从已有的研究以及应用实践中抽象总结出来的,目前仅有一些值得探讨和实现的思路。对任何学科而言,从大量实践中提炼出理论框架是该学科走向成熟的具体体现,学习科学当然也不例外。上面提出的对称性框架是学习科学基本理论的重要补充,不仅适用于在线学习和移动学习等技术支撑下的教育场景,也可以视为人工智能的教育应用走向成熟的阶段性标志。所以,人工智能教育应用的探索和发展也必然要遵循成熟学科应走的道路,这是使我们少走或不走弯路的重要保障。那么,现阶段最突出也是最急迫的问题是,要确立一个面向人工智能教育应用的通用标准体系,并在教育教学研究和实践中遵守。有了这一通用标准体系,学科的研究对象、研究方法、研究问题、研究数据和研究结论就可以在一致的框架下进行横向、纵向比较,也能提升研究结果的可信性、解释性及扩展性。我有幸与教育学、计算机、心理学等领域的同行有过合作。过去几年,我们在一个通用框架——导学系统的通用智能框架(General Intelligent Framework for Tutoring)下梳理智能导学系统的理论问题(Sottilare et al,2013),并已出版系列丛书《智能导学系统设计指南》(Design Recommendations for Intelligent Tutoring Systems)。在此基础上,我们还成功申请了IEEE专门为适应性导学系统而设立的标准化工作组®。除了智能导学理论研究外,最重要的就是学习者与教育资源互动行为数据的标准化。我1999年就和先进分布式学习专业机构ADL(Advanced Distributed Learning)④合作并担任分实验室主任,参与学习内容及数据标准化工作。多年的实践经验让我深刻认识到数据标准化是实现“对称性”的关键。目前我们正在探讨实现上述对称性的最佳行为数据标准,非常希望也诚挚邀请对此感兴趣的同行加入。

 

上面提到的是两个不同层次的工作:一是智能导学的一般框架和理论研究;二是有明显工程特点的数据标准。落实到具体应用中,一项代表性工作就是设计基于对话的智能导学系统,这是我所在团队一直着力推进的研究项目。这个名为AutoTutor的对话教学系统已有20年的研发历史,我们曾撰文对此进行过介绍(高红丽等,2016)。在当前讨论的对称性系统中,我们正尝试以AutoTutor为平台实现第一个可检验的例证。

 

以上是从理论框架说的,将理论框架落实到实践也有许多问题值得注意。既然先进的个性化学习被视为本世纪的难题,这就意味着短时间内彻底解决的想法并不现实,需要我们一步步地踏实前进,但到目前为止,至少我是比较失望的,因为没有人把它作为一个严肃的理论问题提出来。我认为之前设想的以人为中心的教学思路是片面的,我们拥有的教育资源种类和数量都非常丰富,数字资源、物质资源、教师人力资源等是教育资源,绝不能为了关注学生就忽略教师,没有教师或者弱化教师是行不通的。举个简单的例子,某家教育公司告诉我他们在标注题目的知识点,认为辅导系统要应对中高考就需要标题,于是学生在系统中完成了试题,系统马上知道他哪个方面不会。其实,所有的教育公司都在暗中较劲标题,将大批练习题、复习题进行标注,美国也不例外。这一事情应不应该做?应该做,但已经老套了。在数据匮乏时应该标,数据丰富后就不用了。教师都明白教学过程包括两个方面:学什么和怎么学,或者是教什么与怎么教。在学什么的问题上学生不用操心,教师会告诉他,但是学得好不好,不但取决于教师,更取决于学习者会不会学。计算机需要一步步地实现。我刚才提到的一个基本假设,学习者和教师互动会留下永久记忆,而有记忆的系统和没记忆的系统是不一样的,因为没有记忆的系统根本无法做到“人性化”,比如早上问你的问题你认真回答了,下午再问同一问题时,如果你答错了,有记忆的系统可能会很吃惊,上午答对,怎么下午就答不对呢?现在常用的很多系统不是很好,重要原因之一'就是缺之良好的记忆机制。xAPI是个彳了为数据标准系统,能将系统和学习者交互的所有行为数据记录下来(王紫琴等,2017)。本质上它是个格式化的行为数据库,能把人的行为像自然语言的陈述句一样记录下来,如谁,在什么时间,什么环境下,做了什么事情。学习的记忆如果按照规范化的数据结构进行记录,就会变得非常有用,能以此为依据开发理论基础指导下的学习系统。可惜到目前为止,还没有这样的学习系统。但千万不要小看它,也正因为没有这样的系统,现在的在线教育都存在一定局限以及巨大的提升空间。在线教育的最大弊端就是责任无法有效落地,比如我学了半学期现在不学了,谁理我?谁管我?M00C就是这样,互动的缺失是学习者无法坚持的重要原因之一(Hone&El Said,2016)。相反,可以试想一下,如果你面对的是一个不一样的系统,某天没来也不打招呼,你会担心系统生气,因为系统会像真人一样有记忆,会像真人一样批评你,你学习的主动性就会不一样了。可当前的在线教育系统就是个工具,学习者学不学没有关系,基本上都是学习者“剃头挑子一头热”。其背后最重要的原因就在于,我们对待学习系统的根本看法仅仅是朝向学习者这一单向度造成的。所以,观念需要彻底更换。

 

当然,如果把教育资源当作人来开发,确实绝非易事,不过我们可以从简单的项目做起。比如说,学习系统中的自我调节能力,自我调节就是根据系统对你的观察,九点钟前数学题你向来做不好,那么九点钟前你就不要在学习数学上浪费时间了,选择学习这个时段能够学得更好的科目。这方面的研究和实践在其他学科已成为共识了。再比如医生开药,医生一定是了解某种药有没有副作用或有何种副作用后,才会给病人开药方。先进的学习系统为学生推荐学习资源,也应该像医生给病人开药一样,教师或在线学习系统给学生开出的则是教学资源。药品能够帮助患者治病,教学资源能够帮助学习者完善知识结构。现在,大家认为教育资源一定对学生有好处,但需要反思的恰恰是这些教学资源对学生会不会存在副作用?其实,副作用肯定是有的,但会有何种副作用呢?现在我们并不知道,且这样的研究机制也缺乏。所以,我们需要重新接纳新的理论框架,在其基础上将人工智能融入教育。在类似xAPI的数据标准基础上,可以将这种结构化的教育大数据转换成Narsese⑤形式,输入NARS®这类通用人工智能系统。让NARS成为教育资源与学习者“人脑”对称的“机器脑”,也许就能方便地在思维层面观察到教育因素对学习者经验系统建构的深刻影响(刘凯等,2018)。总之,在教育系统的工程实现上,有没有理论思维作为指导,产生的结果差异非常大。

 

记者:胡教授,您提出的框架和基本思路令我茅塞顿开,最大的启发就是加深了自己对教育的理解。我还想就这一理论框架的应用问题向您求教。很多教育者忽略了教育资源这个关键要素,比如孩子们每天要完成很多作业,但很多题目是低效度的,题海战术在中国教育一直很有市场,孩子们真的是在低效学习中浪费了太多宝贵的时光。您如何看待这一现象?

 

胡祥恩教授:这个现象确实存在。在对称性假设下,有什么样的教育资源就有什么样的学习者,反之也成立。优秀的教育资源能够提升学习者的水平,学习者的普遍进步也一定能够反过来改进教育资源的质量,二者不存在先有鸡还是先有蛋的争论,而是动态同步地相互作用。因此,提高教育资源质量是促进学习者发展的重要方式,但教育资源不仅包括题目,还包括教材、教师、实验室、网络资源等。也许我们还可以用生命科学的例子说明教育和学习问题,从而将分析视角放得更开阔些。目前,生命科学非常先进,这是因为它有很多证据保证效果的科学性。比如保健药,吃一粒和吃两粒对身体影响不大,但经过临床验证的药品,多吃一'粒和少吃一'粒就不一样。很遗憾到目前为止,学习科学百分之九十充斥的是营养品,很少有学习产品是经过“临床验证”的“药品”。假如我买了一瓶药,根据临床实验结果它有10%的嗜睡副作用,如果我要开车那么就不能吃。同理,现在有没有某一课件,能明确告诉学生需要在哪种条件下又或者如何去学习?没有。我们的问题是教育市场上充斥的都是营养品,也不知道哪些营养品不能放在一起吃。比如,几何题和代数题要先做哪个后做哪个,先做多少后做多少,还没有研究的佐证。欧美有与药监局平级的官方机构专门负责检验教育产品。不仅如此,欧美也有民间独立的教育质量评估机构。不论是官方还是民间的机构,在应用学校教育的产品时都像对待药物一样谨慎。其实,老师跟医生一样,讲究因材施教和对症下药。总之,我想强调的是,教育一定要做出能通过“临床验证”的真正的“药”。能够把这些做成系统就是好的教育技术应用。美国的ALEKS,它是三十年前一位学者根据学习代数空间理论研发的(Fal-magne,2006),这套系统在帮助学习数理化方面设计得非常好。某道题做对了,说明你掌握了某知识点。但究竟是哪些知识点,这要根据模型计算获得,是有研究依据的。它将数学知识点全部记录下来并按照特定原则进行分解,分得多细呢?对“一位数加法”而言,“不进位的一位数加法”对应一类题目,“进位的一位数加法”对应另一类题目。这套软件包括小学三年级到高中数学的一千五百多个知识点,但仅包含1500多道试题。这样的教育资源就是浓缩的精华,也是高效的,这样的技术能够实打实地解决教育中的真问题。我非常高兴看见国内一些公司开始开发类似ALEKS产品和平台。

 

记者:这样看来,提升教育资源质量真是迫在眉睫。听完您讲的“药”,我又产生了一个疑问,能够通过“临床验证”的“药”在教育资源中属内容问题,那是不是还有一个如何“用药”的问题呢?

相关报道