第八届数据驱动的计算教育学研讨会 ——“AI语料库赋能语言教学与研究”成功举办

数字化转型是大势所趋,是一场深刻的变革,是自我革命和开放创新。数据已成为驱动数字化转型的新动能(Power)。以 ChatGPT为代表的人工智能新进展则进一步展示了数据的无限能量以及数字化转型的无限可能,也为教育的数字化转型提出了更加美好的愿景。

2023年4月15日,由华东师范大学和批改网联合主办,主题为“AI语料库赋能语言教学与研究”的第八届数据驱动的计算教育学研讨会在逸夫楼报告厅成功举办。会议邀请教育研究、教学实践以及大数据和人工智能专家,共同研讨语言教育,特别是中小学英语教学中的教学内容重构,教育科技发展,教学方法和教学研究模式革新乃至范式转变。

研讨会特邀上海市宝山区教育局局长张治,上海市教育考试院外语项目主管徐雯,北京语言智能研究院执行院长,批改网创始人张跃,华东师范大学副校长、教授周傲英,华东师范大学数据科学与工程学院院长、教授钱卫宁,江苏省邗江中学英语特级教师韩炳华,南京师范大学文学院计算语言学方向副教授李斌,华东师范大学数据科学与工程学院教授王伟,上海市嘉定区教育学院教研室主任秦惠康等九位专家学者作主题报告。研讨会分为上下午两个半场,分别由数据科学与工程学院钱卫宁院长和王伟教授主持。

钱卫宁院长在开场主持中表示,随着像ChatGPT这样的人工智能工具和平台的出现,每一个人都能感受到数据驱动的人工智能对教育产生的巨大影响,而语言教育可能更是首当其冲。此次研讨会旨在探讨如何将教育与信息技术深度融合,利用数据驱动的方法优化教育研究与实践,关注如何平衡大规模教育与个性化学习、碎片化学习与系统性构建之间的矛盾,结合中华传统教育智慧,实现有教无类、因材施教和寓教于乐,让数据、AI来赋能语言教学和研究。

张治局长在报告中表示,随着大数据和人工智能技术的飞速发展,教育步入计算教育时代,ChatGPT等人工智能语言模型的开发开辟了新的学习机会,并可能重塑教育的底层逻辑。未来教育变革的方向将从大规模教育转向个性化教育,而教育智能体与教育大脑将作为计算教育的基础核心设施。教育智能体即学习者、学习资源相对于学习过程和环境的对称均衡,是具有自我改进能力的学习资源。教育大脑包含三个基本功能,包括教育智能服务、教育预警以及精准决策和智能治理。张局长提到了“教育大脑”在宝山区基于数字基座的实践,应用场景包括为每个学生构建数字画像,结合“三个助手”实现因材施教,融合虚拟学校与实体学校,记载学习方法,以及AI助力学生生命守护等。他表示,“科教兴国”不仅仅是一句口号,更是一种科学的、有效的、实实在在的行动,人工智能技术的发展既是挑战也是机遇,它们将加速教育大脑的进化,推动教育步入优质高效、个性灵活、公平均衡的新时代。

张治局长以《计算教育学与教育大脑的构建》为题作报告

徐雯老师的报告中提到,语料库是一种科学取样和加工的大规模电子文本库,具备真实、与时俱进、可分析的特征,是科学命制外语类试卷的必要工具。英语母语者语料库帮助我们了解鲜活生动的语言使用规律,且从语境辩词、句子润色改写、高级检索、阅读难度校验四个方面协助老师命制试卷,有助于试卷命制过程中创设真实的语言环境,科学有效地考查学生的语言能力。同时,通过建设英语学习者语料库则可以帮助我们发现学生书面表达能力的变化。她认为,在未来的外语类考试中,将从语言能力、文化意识、思维品质、学习能力等多个方面对学生核心素养进行考察,以多模态、多形式的方式设计考试,随着AI技术的不断成熟,这一趋势将不断加强,人工智能将在依托技术的基础上结合人的灵活性为考试评分提供更加科学的支持。

徐雯老师以《语料库在大规模教育考试中的运用——以上海英语高考为例》为题作报告

张跃院长以批改网批改一篇英语作文为例,给大家演示了批改网在一秒的时间内做出的反馈,包含分数、点评,以及利用丰富且地道的语料库进行修改的内容。批改网利用人工智能技术,将语言认知和语言计算相结合,构建AI英语语料库,从而为英语学习者提供从单词、搭配、词组、句子、文章各个层次的学习、诊断、探究工具和服务,针对每个学生英语学习的优势和薄弱点,用AI技术进行辅助学习,提高教学效果。他表示,批改网最大的改变是缩短了人们在学习英语时的反馈时间,让孩子能在错误中进行自我学习、自我练习,进而达到自我成长的效果。数字化转型是后疫情时代的机会红利,在数字化的时代,每个人都可以拥有自己的数据驾驶舱,用以决策自己的下一步决定。AI提供的不是“答案”,而是“启发”,知识只是开拓了思路,而人做出了最终的决定。

张跃院长以《数据的力量——AI语料库赋能学科》为题作报告

周傲英副校长在报告中指出,面对数字化改革转型,我们需要将升维思考和降维打击相结合,将教育和科技深度结合,并当做一门科学来研究,倒逼技术发展和思维转变,从而形成良性循环。他表示,数字化转型是一场革命,只有改变思维、重新建立新的生态和组织才算完成了转型。数字化就是互联网思维和数据思维的信息化。真正的数字化应该是深入生活、没有门槛,融入原生场景,形成平台经济体系。信息化意味着从以管理为中心向以服务为中心、从服务行政命令向服务用户体验、从传统思维向互联网思维的观念转变,这一切转型的核心动力是数据。数据科学催生的第四范式是第二次科学革命,通过大量已知数据计算,得出之前未知的结论,减弱了对因果关系的渴求,而更加关注相关关系,使科学回归本原,即透过现象看本质。近年来,在线教育在全社会受到越来越多的关注,教育与科技必须紧密结合才能继续发展,教育行业要抓住契机,加快实现教育信息化、教育数字化的转型,用数据智能、人工智能结合传统教育智慧来实现“有教无类、因材施教、寓教于乐、教学相长”的中国教育智慧。

周傲英副校长以《数据赋能教育数字化转型》为题作报告

钱卫宁教授的报告介绍了在数据驱动的大规模教育与个性化学习中的难点,以及数据学院在这方面的努力与成果。他认为教育质量与教育资源和学生数量关系很大,当教师等教学资源总量不变时,如果学生数量大幅增加,教学质量就可能断崖式下降。在线教学模式可以解决这个问题,但在线教育模式又使得学生和老师之间互动少或者没有互动、且需要学生有高度学习自觉,数据驱动的计算教育学则又可以解决后面这个问题。教育平台通过数据收集、算法分析、智能反馈,由人工智能实时对学生的行为、学习情况进行分析,针对学习情况、答题情况给出实时的解答和建议,智能地制定学习路径和推荐课程,从而实现大规模的个性化学习。水杉在线是华东师范大学数据科学与工程学院从2018年起开发运行的“教-学-评-测-练”全链条在线学习平台,已推广至数十所高校的数万名学生使用,在计算机基础课程教学过程中实现数据收集和分析,从而实现因材施教、寓教于乐、全面评价、教学相长。随着ChatGPT等智能服务的推出,需要研发出帮助解决教学难点、提高编程与Debug效率的工具,从而改善教学;同时需要教育和科技的共同努力,开展基于海量数据和学生个性数据进行多维度评估和预测,从而达到大规模教育与个性化学习的目标。

钱卫宁教授以《数据驱动大规模教育与个性化学习》为题作报告

韩炳华老师的报告介绍了智能云笔的内容,包括什么是智能云笔、如何使用、为什么要应用等。智能云笔是一种新型的电子手写笔,配合相关设备,能够实时将学生书写的文字转化为计算机文字并和在线平台联动,进行内容的批改、纠正提示等。批改网云笔秒批以智能纸笔为特色,实现学生作业数据无感采集、智能批阅及智能分析,自动化生成学生错题本,使学习闭环有效时间缩短到一秒钟,助力教师高效教学,促进教学管理的数字化和智能化。智能云笔使教学对象由“整体”走向“个体”;教学地位由“教师主导”走向“学生主体”、由“被动”走向“主动”;教学活动设计由“预设”走向“生成”、由“依靠经验”走向“依据数据”;教学评价由“延迟”走向“实时”、由“结果”走向“过程”,体现动态成长,实现“教、学、评”的一体化,助力教育数字化转型。

韩炳华老师以《智能云笔催生英语教学新样态》为题作报告

李斌副教授在报告中指出,数据科学是一个非常有前景的领域,而语言数据语料库的构建在其中扮演着重要的角色。他介绍了计算语言学方向的相关知识,并着重讲解智能教育语料库的构建方法和应用场景。语料库的应用对语言教学和语文教学起着至关重要的作用,尤其是在古籍语料库方面的研究更加具有挑战性和前瞻性。他分享了自己实验室在语料库研究上的一些心得,展示了《左传》、《资治通鉴》等先秦以来古文语料库的特点和应用场景。他认为在古文教育里,深标注的语料库十分有用,且能够产生很好的效益,希望能和更多老师共同推进这项事业。

李斌副教授以《面向智能教育的语料库构建与应用——以古籍语料库为例》为题作报告

王伟教授的报告介绍了教育评价面临的变革、数据驱动的计算教育学以及评价数据可视化的重要性;介绍了人工智能对教育的影响;讨论了在人工智能时代高校应该教什么。他认为,现在应该更多地关注人类在人工智能领域的创造力,用人工智能来辅助完成一些工作。如水杉在线平台是以计算机通识课为落地场景,涵盖“教学测、评、练”各个功能模块,有效构建学生评价指标和数字画像并可视化。他指出水杉在线既是学习平台,更是评测工具,并举例介绍了计算机新生第一课业务的试点和验证。这种教育评价方式以及其可视化观测等多项优势已经在学院目前开设的部分课程上取得了很好的实践效果。

王伟教授以《数据驱动的教育评价及其可视化应用》为题作报告

秦惠康主任的报告介绍了上海市教育系统资源平台在提升教学效果上的研究,分享了自己对于数字化转型产品实证研究的结论和心得体会。他提到,在数字化转型的过程中,确实缺乏好用的教学产品。目前上海市教育系统的三个平台助手在全市推广使用。他的实证研究,即针对数字资源的使用是否有正向作用这个关键问题,在一线教学场景下通过实验班和控制班的设计,进行为期两个月的实验。实验班使用数字资源,控制班不使用。测试的指标主要使用了型符和类符、分级覆盖率来测量学生对于上课教学内容的语汇产出质量,得到的结论是,使用数字资源后,学生词汇产出质量明显提高。此外,他提出数字资源的设计起到了主导作用,即资源的设计大于形式。

秦惠康主任以《数字化资源赋能高中学生话题语汇习得的实证研究——以“英语视听说教学与词汇产出质量”单元教学为例》为题作报告

专家报告内容既有深度又有广度,全方位多角度地介绍了计算教育学的发展现状与前景,以及智能教育语料库的构建与应用等,让与会者受益匪浅,获得了一致好评。主办方为每位演讲专家颁发了证书,感谢他们为研讨会的成功举办做出的杰出贡献。

主办方为演讲专家颁发证书

现场与会者认真聆听专家报告,研讨会同步开启腾讯会议直播

专家和嘉宾们现场参观批改网智慧课堂、在线教育平台的实时演示

研讨会间隙,专家和嘉宾们现场交流

本次研讨会围绕“AI语料库赋能语言教学与研究”的主题,深入探讨数据科学和人工智能快速发展下进行教育数字化转型的无限可能,且提出了更加美好的愿景。相信在未来,实现数字化转型的教育将充分发掘学习行为数据的巨大潜力,利用 AI 实现“大规模教育,个性化学习”,“碎片化学习,系统性构建”这两对看似矛盾的目标,使教育发展迈向新阶段。

与会人员合影

来源:华东师范大学数据学院

en_GBEnglish