从生成式大模型到个性化教育场景

来源:2023年度智慧教育优秀案例 2024-08-01 14:14:52 所属栏目:案例实践

基于微软提出的文档智能多模态预训练模型LayoutLMv3,未来计划开发知识点识别模型提取视频中PPT的知识点。该模型类似自然语言处理领域中的命名实体识别模型,利用从视频中抽取出的画面、文字内容、文字的大小和相对位置等信息,判断哪些文字是课程的“知识点”。

本文大概

读完共需

分钟

一、国开终身教育平台建设背景与数字化建设实践

(一)国开终身教育平台建设背景

终身教育平台是国家开放大学坚定推进国家教育数字化战略行动,建设“人人皆学、处处能学、时时可学”的全民终身学习的学习型社会,构建服务全民终身学习的教育体系,推进教育公平、减少“数字鸿沟”,在现有“一路一网一平台”基础上打造的,涵盖生活技能、兴趣爱好、职场素养、职业技能、老年学习、学历继续教育等六大领域的公益性终身教育平台。该平台不同于高等教育、基础教育、职业教育平台,有其特定功能需求,核心价值是提供校园教育外的高质量教育服务供给,公开公平地为有学习意愿的社会成员提供伴随一生的教育服务。

(二)国开终身教育平台建设成效

一是服务用户2600万余人,引起社会广泛关注。2022年5月平台上线运行以来,平台累计服务学生2600万余人,已上线音视频学习资源63万余条,注册用户132万余人。平台上线后获得央视新闻、中央电视台朝闻天下、新闻直播间、人民网、光明日报等国内主流媒体多次报道,引起社会各界的广泛关注,并登上微博热搜榜第一名,相关新闻当日浏览量达3.7亿次,被广大网友誉为“国家赠送的六大神器之一”、“学生党必备学习资源”。

二是汇聚顶尖知识资源,助力个人成长。同时,国开终身教育平台通过多种渠道汇聚遴选优质资源,共上线课程系列数量12000门,课程数量63万条,累计时长8万分钟,汇集第三方平台课程资源57万余个,包括爱奇艺、得到、虎课网、网易云课堂等十余家知识付费类平台。累计服务终身学习者2800万+人次,用户累计时长15000万余小时,合作院校/知识付费企业近千家。

三是构建全方位学习评估和证书认证体系,推动终身教育高质量发展。为了保障学习者的学习成果得到有效认可,国开终身教育平台还构建了完善的学习评估和证书认证体系。学习者可以通过在线考试等方式进行学习成果评估,并获得由国家开放大学职业教育学分银行颁发的合法证书。通过整合优质教育资源、提供高水平的在线学习课程以及构建完善的学习评估和证书认证体系等手段,国开终身教育平台大幅提高了我国终身教育体系的质量水平,为广大学习者提供了更好的学习体验和职业发展机会。

二、人工智能赋能国开终身教育平台的重点举措

(一)推进数字人“白泽”形象建设

在上线一周年之际,国开终身教育平台推出了虚拟IP数字人形象“白泽-智慧学伴”,这是国家开放大学响应国家号召,以人工智能赋能终身教育行动的关键举措。以国家开放大学庞大的学习资料库、外部知识库等作为语料,训练大模型能够为终身教育平台的用户提供更好的学习体验,包括帮助用户精准筛选关键内容、精准定位内容,学习并梳理内容大纲,以及个性化地规划用户学习路径、高效地回答学习过程中的各种疑问等。

(二)推动生成式人工智能技术建设

一是构建以“式说”大模型为能力底座的人工智能系统。“白泽-智慧学伴”系统是一种基于国内自主知识产权的“式说”大模型的智能问答系统,它能够为用户提供高质量、个性化的教育服务。该系统的专有生成式大语言模型是利用相关知识库数据定制化训练而成,具有强大的语义分析和理解能力,可以自动回答用户的各种问题。除了自动回答问题外,该系统还提供了针对单次问答的满意度评价功能,以及针对“智慧学伴”系统试用的意见反馈功能。这些反馈信息将被记录到系统后台,用于后续优化问答效果。

二是针对具体课程探索人工智能,助力用户高效学习。目前,“智慧学伴”系统已在《生态摄影》和《Python程序设计》的Web端课程访问页面上线,无论是想要深入了解摄影还是掌握Python编程技巧,都可以通过点击右下角“白泽-智慧学伴”,获得个性化的知识点指导。

三、“白泽-智慧学伴”的未来应用展望

(一)语音和文字识别技术,优化资源检索能力

在目前的终身教育平台中,用户可以通过两种方式获取平台课程信息:搜索引擎和频道推荐。搜索引擎会从国家开放大学自建资源、国内高校课程资源以及其他合作平台收集课程信息,包括视频标题和描述等,并将其存储到数据库中。然后,使用全文搜索引擎Elasticsearch构建索引,实现快速文本检索。最终,用户可以通过关键词搜索找到相关的课程和视频。频道推荐是由编辑人员挑选出的各个频道优质的课程,放置在首页展示,并定期更新。

未来我们会对平台的搜索引擎的检索范围进行升级。将使用语音识别软件,将自有版权的全部教学视频进行语音识别,并生成字幕,然后将教学视频每隔一秒进行抽帧,使用文字识别软件识别出画面中的文字,初步完成了教学视频内容的两个维度——语音和图像的数据挖掘。我们将这些信息都加入到全文搜索引擎的索引中以及向量数据库中,这样就分别实现了对视频字幕和文字内容的全文检索功能和语义检索功能。

(二)自动抽取视频章节技术,增加视频章节信息

在获取了教学视频的字幕和画面文字信息后,未来我们将对相关信息做进一步提炼和应用。借助国家开放大学“数字化学习技术集成与应用教育部工程研究中心”(简称工程中心)在人工智能结合教育方面的研究成果,实现了自动化的抽取课程视频的章节信息,以及提取视频知识点的功能。

(三)智能知识点提取技术,提取视频标签

基于微软提出的文档智能多模态预训练模型LayoutLMv3,未来计划开发知识点识别模型提取视频中PPT的知识点。该模型类似自然语言处理领域中的命名实体识别模型,利用从视频中抽取出的画面、文字内容、文字的大小和相对位置等信息,判断哪些文字是课程的“知识点”。

(四)应用大语言模型,生成视频摘要

我们在“白泽-智慧学伴”中,除了将大语言模型作为对话系统的中枢外,未来还将利用大语言模型的文字生成能力,进行内容的生产。如利用大语言模型,借助视频的字幕信息生成视频摘要。

 

作者:郑晨 孙北辰 贺媛婧 赵艳 张欢 王卫燕 王健 胡时伟 陈雨强 杜海洋  程罡 李静 袁亚兴

来源:2023年度智慧教育优秀案例

标签:智慧教育优秀案例

版权申明:本网站内容均为本站原创文章或网友转载,涉及版权问题请联系管理员删除,转载亦请申明来源.

上一篇:教育信息化背景下“双师教学”模式的应用研究
下一篇:技术赋能,探索学校“三四五”数字化学习新样态