您的位置 首页 资讯

荟萃英才教育快讯:教育部深入推进这一领域建设!

【荟萃英才教育:荟萃英才教育品牌集团成立于2013年,经过将近10年的发展,聚焦国内外优质教育资源,专注互联网学历教育和职业技能培训领域,核心优势于现代在线教育课程服务和开发,让在…

【荟萃英才教育:荟萃英才教育品牌集团成立于2013年,经过将近10年的发展,聚焦国内外优质教育资源,专注互联网学历教育和职业技能培训领域,核心优势于现代在线教育课程服务和开发,让在职成人提升学历变得更轻松简单。】

3月31日下午,教育部召开新闻发布会,介绍深入贯彻落实《教育强国建设规划纲要(2024—2035年)》,推进语言文字信息化发展情况。

发布会由教育部办公厅副主任、新闻办主任陈星主持;教育部语言文字信息管理司司长刘培俊,教育部语言文字应用管理司副司长王晖,广东省委教育工委委员 省教育厅党组成员、副厅长朱建华,北京师范大学党委常委、副校长康震,北京大学王选计算机研究所所长汤帜出席发布会。

来看详细内容——

67fe1ac232177

新闻发布会现场  中国教育报记者 张劲松/摄

教育部语言文字信息管理司司长 刘培俊

介绍推进语言文字信息化发展和数字中文建设有关情况

67fe1ac29e3c3

教育部语言文字信息管理司司长刘培俊介绍推进语言文字信息化发展和数字中文建设有关情况。(中国教育报记者 张劲松/摄)

刘培俊:为落实《教育强国建设规划纲要(2024—2035年)》,近日教育部、国家语委、中央网信办共同印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,部署应用关键新技术,构建资源数据新体系,实施赋能全局新行动,全力服务教育强国、科技强国和文化强国建设,为以中国式现代化全面推进强国建设、民族复兴伟业贡献力量。我主要介绍三方面情况。

第一,党的十八大以来系统发力,推动语言文字信息化服务取得新成效。

一是语言文字信息化建设持续加强,有力服务科技自立自强。大幅度扩充语言文字信息处理技术标准。会同有关部门推动研制并发布了《信息技术 中文编码字符集》等国家通用语言文字和民族语言文字信息化规范标准100多项,为自然语言处理技术在人工智能、数字产品和信息产业领域的应用创新奠定规范基础。

大力度支持语言文字信息处理技术创新。清华大学、北京大学、哈尔滨工业大学等开展了语言文字信息技术的深度研发,促进中文信息互联互通。其中,北京大学王选计算机研究所建成了中华精品字库。大规模构建语言资源体系。建成了世界最大规模语言资源库和中国语言资源知识图谱,多模态集成120多种语言和方言资源。大领域布局大语言模型技术应用,聚焦关键领域的需求,试点建设了一批自主安全可控的大语言模型。其中,北京师范大学古汉语大语言模型等已上线。

二是语言文字智慧化学广泛开展,有力服务教育改革创新。高水平开展普通话水平测试,全面实现从人工到智能的普通话测试方式转变,制发电子证书9000多万份。广东省建成全国首个普通话水平测试智慧考场。高标准建设语言学资源。开通国家智慧教育平台语言服务栏目,建成国家通用语言文字学平台,汇聚8000多项学资源,打造中华经典资源库、中小学语文示范诵读库等。高起点规范数字空间语言文字,发布《信息技术产品国家通用语言文字使用管理规定》,规范信息技术产品研发,会同有关部门开展“清朗 规范网络语言文字使用”专项行动。

三是语言文化网络化资源加速共享,有力服务中华文化传承。多领域推动语言文化资源共建共享。建成国家语委媒体语言语料库、冬奥会多语言术语库、公共服务领域译写规范术语库、规范标准课程库等30多项,多渠道打造示范平台。上线国家语言资源服务平台、中国语言文字数字博物馆、中国语言资源博物馆数字展区等。指导各地各校开展云端学等课程平台。多模式推进传承传播。数字赋能让收藏在博物馆的文物活起来,支持联合开展古文字数字化研究,开通甲骨文数据平台,传承中华优秀传统文化根脉。

四是语言文明智能化传播联通世界,有力服务国际交流互鉴。深层次推进中华思想文化术语传播。数字赋能让书写在古籍里的文字活起来,建成中华思想文化术语数据库,面向国际传播1200多条反映中华民族话语体系中最核心最本质的思想文化术语,并与40多个国家和地区开展多语种数字版权合作。深融合助力数字资源建设。已建成集成化、智能化、国际化的全球中文学平台,用户超1600万人,覆盖190多个国家和地区,深度化合作建立联盟,中文学联盟云服务平台提供3万门在线课程,与中外1600多家机构合作,推动实现中文人人、时时、处处可学可用、易学易用。

五是语言科技数字化赋能产业升级,有力服务经济社会发展。广角度支持科研攻关。发布汉字简繁文本智能转换系统,大语言模型评测技术等百余项科研成果。广布局设置科研机构。设立中国语言智能研究中心、多语种信息技术研究中心、语言技术与数字经济研究中心等,形成语言科技研发方阵。广联动鼓励成果转化。支持有关高校联合人工智能及信息服务领域头部企业,研发语言翻译、智能语音、大语言模型等产品。

经过多年努力,语言文字信息化以应用为导向、以服务为主线,形成了多语种资源广泛开发、多方面技术创新应用、多类型主体共同推进、多维度赋能发挥作用的良好局面,有效服务经济社会高质量发展。

第二,锚定战略性需求来科学规划,明确当前和今后一个时期语言文字信息化发展新部署。

为抢抓大语言模型迭代升级新机遇、助力“人工智能+”新行动、回应经济社会发展新需求,教育部、国家语委、中央网信办印发《关于加强数字中文建设 推进语言文字信息化发展的意见》,推进语言文字和信息技术深度融合、系统部署语言文字信息化发展。主要有三个方面。

一是聚焦一个突出重点,以加强数字中文建设为重点,全面推进语言文字信息化发展。《意见》明确提出,加强数字中文建设的理念、政策、行动和项目,将数字中文建设作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的突出重点,全方位释放语言文字在经济社会发展中的数据要素价值,着力推进中文数字化与数据中文化,着力推进创新应用与规范安全,着力推进新型中文服务体系构建与语言文字治理体系完善。在实践中,既要规范、有效、批量地将中文资源信息转化为智能数据,也要促进中文数据的规模生产、优质集成、规范治理和复用增效,实现以数字化手段构建新型中文服务体系,引领带动语言文字信息化全面发展。

二是明确两步发展阶段,有序实现2027和2035年语言文字信息化发展目标。第一步到2027年,是以数字中文建设为重点的强基示范阶段,形成语言文字信息化推进机制,推动语言文字信息化规范标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。第二步面向2035年,是全面推进语言文字信息化发展的深化赋能阶段,推动承载中华文化的中文在全球数字空间、网络空间以及生成式人工智能等关键场景中的使用占比和价值引领作用显著提高,实现我国语言文字信息化整体水平位居世界前列。

三是部署三项重大任务,统筹推动技术创新、体系保障和关键赋能落地见效。创新应用自然语言处理、大语言模型、多模态信息处理、知识图谱、语料加工等五项前沿技术,重点服务大语言模型等人工智能技术创新应用“制高点”,夯实国家关键语料基础设施“新基建”。系统建设语言文字规范标准、资源服务、人才培养、协同创新和安全治理五大保障体系,重点提升语言文字信息化的基础能力。统筹实施数字中文服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步等五大赋能行动,重点推进语言技术与关键领域需求深度融合应用。

第三,创新长效化机制协同行动,构建数字中文建设赋能全局新格局。

今年,是落实《教育强国建设规划纲要(2024—2035年)》的关键之年,语言文字信息化发展将展望十年、谋划五年、立足三年,把握赋能全局高度,加快试点先行进度,激发协同创新力度,在落实重点任务上下功夫、见实效。

一是以重大应用作为战略牵引,有效满足需求。坚持需求牵引,加快建设国家语言文字大数据中心、国家关键语料库和国家语言资源信息库。坚持深度融合,推进自然语言处理技术、大语言模型等创新应用,坚持资源开发,分类建设基础性、应用性、战略性、特色性等多类高质量语言资源。坚持数据应用,支持语言文字信息技术新产品、新职业、新业态发展。坚持数字赋能,推动数字中文发挥立德树人的基础作用、推进科技创新的支撑作用、传承中华文化的根脉作用、赋能产业升级的关键作用和服务社会需求的民生作用。

二是以示范项目支撑重大任务,有效以点带面。在技术创新应用上,发挥自然语言处理技术支撑人工智能发展的基础作用,主要包括:加快领域大语言模型应用试点,确保规范安全,示范应用;研制面向人工智能的语言资源建设、管理、应用标准特别是语料和数据质量评价标准等。在数据资源建设上,发挥语言文字服务国家语言能力建设的战略作用,主要包括实施国家关键语料库建设计划,建设大规模中文语料库等。在关键领域赋能上,发挥信息技术赋能国家语言服务体系构建的全局优势,主要包括研制大语言模型能力素养框架(师生版),推进甲骨文数字化共享,实施中华文化优秀课程多语种数字化传播计划等。

三是以机制创新增强工作动力,有效落实任务。健全政府主导、部门协同、社会参与、共建共享的信息化推进机制。鼓励一地一策、一校一品制定数字中文建设计划,支持创建试验区和示范点,营造稳中求进、务求实效、数字赋能的良好氛围。

谢谢大家。

教育部语言文字应用管理司副司长 王晖

介绍数智赋能语言文字高质量发展有关情况

67fe1ac2eeb23

教育部语言文字应用管理司副司长王晖介绍数智赋能语言文字高质量发展有关情况。(中国教育报记者 张劲松/摄)

王晖:教育部、国家语委深入贯彻党的二十大和二十届二中、三中全会精神,全国教育大会精神,落实教育强国建设规划纲要和三年行动计划工作部署,全面把握教育“三大属性”,聚焦教育数字化战略行动,持续提升语言文字信息化、数字化、智能化水平,推动新时代语言文字事业高质量发展,筑牢教育强国建设语言基石。今天主要和大家交流三方面工作,概括为“三个聚焦”。

第一,聚焦国家战略,大力提升语言文字信息化基础能力。

语言文字工作是国家综合实力的重要组成部分,在国家治理和战略规划中具有重要地位和作用。我们充分发挥语言文字作为信息载体的重要作用,大力提升国家战略服务能力。

一是推动语言国情国力调查取得突破。2025年立项实施新时代首次全国语言文字使用情况调查,打造集数据采集、传输、存储、加工一体的集成化调查平台,为深化教育综合改革和综合国力分析提供大数据支撑。

二是布局新型国家语料库建设。整体建设分期分批推进,将为提升我国大语言模型建设的核心竞争力提供规范、可信、高质量的语言文化资源。

三是开展网络语言文字应用治理。与中央网信办共同开展“清朗·规范网络语言文字使用”专项行动,加强网络语言文明教育,为构建清朗文明的网络空间贡献力量。

第二,聚焦核心任务,数智赋能国家通用语言文字推广普及。

推广普及国家通用语言文字是助力铸牢中华民族共同体意识的重要手段,是服务立德树人根本任务的重要途径。我们充分发挥数智赋能的倍增效应和乘数效应,不断提升推普质效。

一是以测引学,持续升舱普通话水平测试信息管理系统。全面开展计算机辅助测试,构建跨部门、跨层级的数据共享网络。目前,机辅测试服务已超过9200万人次,测试数据已接入国家和省级政务服务平台、国家智慧教育平台,有效提升了测试服务能级。

二是以培促学,不断完善国家通用语言文字培训平台。2020年上线以来,平台已免费开放优质培训资源、直播课程150余门。

三是以智助学,加强“推普智能+”教育产品研发应用。推动有关高校、单位,如清华大学“九歌——人工智能诗歌写作”系统、科大讯飞公司“国家通用语言文字学”系统等研发应用,在全国推普周期间举办群众性展示体验活动,拓展智能化推普新领域、新空间。

第三,聚焦语教融合,打造语言文化数字化学宣传平台。

语言文字是教育的重要载体,也是教育的重要内容。我们聚焦支撑教育强国系统跃升的“八大体系”,大力推进语教融合。

一是上线中国语言文字数字博物馆。实现电脑端和移动端同步同频,语博包含多类型海量优质资源,打造“掌上可学、好玩好学、人人能学”的新时代全民学新课堂。

二是丰富语言文化精品数字资源。有代表性的是两个精品资源库——“中华经典资源库”和“中小学语文示范诵读库”,两库都邀请众多名师名家倾心打造。“中华经典资源库”总浏览量超6000万人次,“中小学语文示范诵读库”联合中央广播电视总台共同打造,被誉为“最好听的语文”,惠及全国约1.6亿中小学生和上千万教师及社会大众。

三是升级中华经典诵写讲大赛官网。官网不仅是信息发布、赛事组织管理的平台,还是资源共享、优秀作品展示宣传的平台。网站总点击量超过4000万人次。目前大赛已成功举办六届,第七届大赛上周刚刚启动,新版官网将为其提供全过程服务保障。

以上是我今天介绍交流的主要内容,谢谢。

广东省委教育工委委员 省教育厅党组成员、副厅长 朱建华

介绍广东省推进语言文字信息化发展有关情况

67fe1ac315ebc

广东省委教育工委委员,省教育厅党组成员、副厅长朱建华介绍广东省推进语言文字信息化发展有关情况。(中国教育报记者 张劲松/摄)

朱建华:广东是经济大省、人口大省也是教育大省,教育规模位居全国前列。近年来,在教育部、国家语委的指导下,广东省教育厅认真学习近总书记关于教育的重要论述和关于语言文字工作的重要指示批示精神,按照“五个坚持”的工作思路,深入推进语言文字信息化建设,大力推进教育数字化转型,服务和全面赋能广东教育强省建设。

我们坚持国家重大需求牵引,立足服务粤港澳大湾区高质量发展,依托广州大学成立国家语言服务与粤港澳大湾区语言研究中心,利用语言技术赋能语言服务、语言生活、语言规划、语言政策学术和咨询研究,承建国家语言资源服务平台。

我们坚持深化语言文字与信息技术的融合,支持香港科技大学(广州)发挥智算集群力量,研发涉及语言知识学与生成、跨平台交互与服务集成建设的语言服务大模型。支持哈尔滨工业大学(深圳)研发多语言翻译模型。

我们坚持发挥语言文字资源功能,利用中山大学古文字学科优势,聚焦古籍整理与活化、非物质文化遗产数字化保护等,打造古文字数据库。依托北京师范大学珠海校区开展港澳地区分学科平行多语科技名词术语数据库建设。华南师范大学附属小学利用人工智能技术,建设汉字数字博物馆,把抽象的汉字知识转化为生动直观的育人资源。

我们坚持释放语言文字数据要素价值,在广州大学设立粤语语料库建设与大模型评测重点实验室,为语料基础设施建设、语言智能应用等提供坚实数据支撑。指导深圳大学建立语言障碍多模态数据库,涵盖汉语失语症语料库、儿童语言障碍语料库,有力服务语言康复研究。

我们坚持赋能教育改革发展,以国家中小学智慧教育平台为核心,建立国家、省、市、县、校五级平台资源服务体系,推动数字化教学资源互通共享。我们加大国家通用语言文字推广普及数字化赋能力度,支持广东省外语艺术职业学院研发普通话水平智能测试舱、声纹分析系统等,打造全国首个以智能化为核心的普通话水平测试智慧考场,首创“随到随考”测试模式,普通话测试效率大幅提升。

为贯彻落实《教育强国建设规划纲要(2024—2035年)》部署,充分发挥数字中文建设赋能作用,当前和今后一个时期,广东省将着力实施语言文字信息化五大赋能行动。一是赋能教育发展行动,重点聚焦数字化语言资源课程和智慧教学新范式,发挥人工智能技术优势,构建丰富多样的数字课程资源库,优化师生教育教学模式。二是赋能科技创新行动。重点依托高校,吸引顶尖科研人才,开展大语言模型等前沿技术科研攻关,加强优质语料基础设施建设投入,服务高水平科技自立自强。

三是赋能文化传承行动。重点加强古籍数字化整理技术研究,运用图像识别、文字转换等技术,对珍贵古籍进行高效、精准的数字化处理,保护和传承中华优秀传统文化。四是赋能产业升级行动。重点支持粤港澳大湾区智能语言服务产业高质量发展,打造具有国际竞争力的语言产业集群。五是赋能社会进步行动。重点指导建设应急语言数据库和智能翻译系统,提高多语言应用场景下的服务能力。

广东被赋予在推进中国式现代化建设中走在前列的使命任务,在教育强国建设上,也要力争走在前、作示范。我们将以加强数字中文建设为重点,推动语言文字信息化发展取得新成效,服务一体推进教育强省、科技创新强省、人才强省建设,为强国建设贡献力量。

我就介绍这些,谢谢。

北京师范大学党委常委、副校长 康震

介绍北京师范大学创新应用大语言模型等语言文字信息技术情况

67fe1ac363f0e

北京师范大学党委常委、副校长康震介绍北京师范大学创新应用大语言模型等语言文字信息技术情况。(中国教育报记者 张劲松/摄)

康震:《教育强国建设规划纲要(2024—2035年)》提出以后,建设学型社会,以教育数字化开辟发展新赛道,塑造发展新优势。当前,世界范围内的人工智能技术创新态势和竞争格局加速形成,正在深刻地影响教育的深层次变革。北京师范大学认真学关于教育的重要论述和关于语言文字工作的重要指示批示精神,积极探索大语言模型赋能教育教学的关键举措和有效做法,助力教育强国建设。下面,我主要从三个方面介绍一下我们学校在这方面做的工作,概括的讲就是“三个全”。

第一,全方位建设关键领域语料库。推动中国特色大语言模型建设离不开大规模高质量的中文语料数据库、数据集。北京师范大学长期致力于数字化赋能关键学科领域研究,建设了通用汉字全息数据库,《说文》学数字资源库、历代碑刻与手写文字属性资源库、甲骨文拓片资源库等专业数字资源库。研发了中华大字符集、甲骨文小篆字库与国际编码,创建了汉字全息资源应用系统、数字化《说文解字》研究与应用平台,历代碑刻与手写文字数字典藏系统等大型的数字化平台,形成了具有创新性、专业性、权威性特点的语言文字学研究新格局,有力助推了关键学科领域建设和创新发展,为教育强国建设作出了积极的贡献。

第二,全流程自主研发大语言模型。为积极应对以大语言模型为代表的人工智能技术对教育变革带来的新机遇、新挑战,北京师范大学依托文学院、国际中文教育学院、人工智能学院建设的系列大语言模型,取得突出成效。中国文字整理与规范研究中心秉持“师古而不复古、坚守而不保守”的学术理念,发挥古籍整理智能化关键技术优势,针对古汉语信息处理任务“低资源”“富知识”的特点,以解决领域知识学需求为核心任务,使用1.8B(18亿)参数量,训练出理解力强、准确率高、应用场景丰富的“AI太炎”古汉语大语言模型。

该模型坚持自主可控和安全可信的技术路线,在确保语料来源安全、语料内容安全、语料标注安全、模型安全等基础上,能够高质量完成古典文献释读,支持字词释义、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务。该大语言模型处于同领域国际领先地位,受到学界、产业界的好评。截至目前,该模型已广泛应用于海内外的学术科研、基础教育、编辑出版等多个领域,辅助古籍整理、语言研究、语文教育、辞书编纂等应用场景的任务。

第三,全融入打造智慧教育新生态。北京师范大学深入推进教育数字化战略,强化科技教育和人文教育协同。一是构建“五方协同、四维融合”的体系,以促进信息技术与教育教学的深度融合为核心,以应用驱动和机制建设为动力,推动制度建设、课程建设、教室建设、平台建设,着力打造数智化赋能教育教学新生态。二是探索数智化赋能教育教学新模式。我校“创新‘AI+’课堂教学智能评测”案例入选首批“人工智能+高等教育”应用场景典型案例,“5G+智能育人综合应用试点项目”获评全国典型项目排名第一。三是深化自主开发平台应用。今年新学期,北京师范大学基于本地化部署DeepSeek-R1模型,利用培养方案、教学手册、教学大纲等语料,为本硕博学生共计9958门课程自主研发了情景化的智能助教平台。

下一步,北京师范大学将认真贯彻落实《教育部 国家语委 中央网信办关于加强数字中文建设 推进语言文字信息化发展的意见》,持续推动学科交叉融合和协同创新,强化有组织科研,加快培养复合型人才,推进国家关键领域语料库和智能化关键技术研发,探索大语言模型创新应用新范式,为教育强国建设贡献更多的智慧和力量。

这就是我介绍的情况,谢谢大家。

北京大学王选计算机研究所所长 汤帜

介绍中华精品字库工程建设情况

67fe1ac3b591d

北京大学王选计算机研究所所长汤帜介绍中华精品字库工程建设情况。(中国教育报记者 张劲松/摄)

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。
没有了

已是最早文章