您的位置 首页 英语学习

看人工智能英语测评如何帮助老师和学生

人工智能离咱们愈来愈近,而说话讲授与测评根基上仍是沿用传统人工果断,重要的缘由是人与人之间感情沟通是动态的,是可以随时随地产生变革,是可以经由过程交互被开导并超凡阐扬的,可是效能与效力之间老是存在抵牾,人力始终是有必定的局限性,等待将来的出色。

如下文章来历于培生教诲 ,作者培生教诲

培生教诲

咱们是全世界教诲公司,咱们营业遍布全世界70个国度,24000
看人工智能英语测评如何帮助老师和学生插图
多名员工整力于帮忙人们经由过程进修获得糊口中的前进。咱们经由过程办事与科技驱动,将世界级的教诲内容与测验测评相连系,帮忙实现更有用的讲授和范围化的个性化进修 。

计较机主动阅卷,和AI的利用是最新教诲技能解决方案之一。它能提高阅卷效力、解除主观成见、正确并跟人类考官同样靠得住。跟着立异技能的成长,它将真正扭转教与学。

但是,主动阅卷技能不成防止遭到了质疑——计较机真的可以正确评判白话和浏览能力吗?谜底是“可以!”。来自世界各地的学生已起头利用AI分级测试。比方,培生PTE少儿英语测评(PTE Young Learners)和English Benchmark 少儿英语测评(English Benchmark Young Learners)为白话和写作测验供给了公道、公允和快速的主动评分,非论考生在哪加入测验,其口音或性别若何。

让咱们看看人工智能主动评分若何能帮忙教员和学生。

人工智能与传统的主动评分

当咱们谈到传统的主动评分时,凡是是对多项选择题或完形填空题举行评分。不管是为句子从新排序、从下拉列表中举行选择、或是填写一个缺失的单词等等,这些类型的标题是为了测试特定的技术而设计的,主动评分可以确保每次都能快速正确地评分。固然如许的主动评分项目可以用来评估听力和浏览理解等输入技术,但它们不克不及标识表记标帜写作和白话等输出技术。每一个学生在写作和白话项目上的答复都是分歧的,那末计较机若何标识表记标帜它们呢?

这就必要AI技能的帮忙。咱们常常听到人工智能若何愈来愈多地用于必要处置大量非布局化数据的范畴,这些范畴必要有用且100%正确地处置数据。在说话测试中,人工智能利用专门的计较机软件对笔试和面试举行评分。

人工智能是如作甚白话测试评分的

第一步是为每种说话创建一个声学模子,可以或许辨认语音并将其转换为波形和文本。然后,这些声学模子被练习来为测试中的每一个提醒或项目打分。咱们起首利用人类专家评分员对项目举行评分,举行两重标识表记标帜。在为每个项目得到数百个口头答复后,这些“尺度”被用来练习引擎。

接下来,咱们经由过程输入更多带有人类标识表记标帜的项目来验证练习过的引擎,并查抄呆板得分与人类得分之间的高度相干性。测试将被标识表记标帜在95%-99%之间,与人类标识表记标帜的样本彻底不异。

与靠得住的人类白话测试比拟,这个数字高得使人难以置信。本色上,咱们利用一组高度专业的人类评分员来练习AI引擎,然后他们的尺度一次又一次地被复制。

人工智能是如作甚写作测试评分的

咱们的人工智能写作评分利用了一种叫做潜伏语义阐发(LSA)的技能。LSA是一种天然说话处置技能,可以基于单词暗地里的寄义而不但仅是它们的概况特性阐发和评分写作。

与咱们的语音辨认声学模子雷同,咱们起首创建了一个特定于说话的文本辨认模子。咱们向体系输入大量文本,而LSA利用人工智能来进修单词之间的互相瓜葛和单词在英语中利用的模式。一旦创建了说话模子,咱们便可以练习引擎在测试中为每一个零丁的书面项目打分。和白话项目同样,咱们起首利用人类专家评分员对项目举行评分,利用双标识表记标帜。为每项都获得数百个书面复兴,然后这些“尺度”被用来练习引擎。接着,咱们经由过程输入更多带有人类标识表记标帜的项目来验证颠末练习的引擎,并查抄呆板得分与人类得分之间的高度相干性。

这个基准老是人类专家的分数。若是咱们的人工智能体系不克不及很好地匹配人类标识表记标帜给出的分数,咱们将删除该项目,由于匹配人类标识表记标帜设置的尺度很是首要。

人工智能主动评分的益处

西席领会学生并供给小我反馈和建议是很是首要的。但是,天天或每周手工修正数百份考卷多是反复的、耗时的,并且其实不老是靠得住的,还会占用与学生一块儿上课的时候。在构成性和总结性评料中利用人工智能可以增长学生的评估实践时候,削减西席的评分包袱。说话进修必要长时候的堆集才能到达纯熟水平。利用AI可以:

解决构成性评估对驱动个性化进修和诊断性评估反馈日趋首要的问题容许学生在分派的讲授时候表里举行操练并得到即时反馈解决西席事情量的问题缔造人与呆板之间的良性连系,各取人和呆板所长在高利害测试中供给公允、快速和公道的总结性评估分数在构成性和总结性评料中,人工智能永久不会代替西席的脚色。人工智能将为西席供给支撑,为学生供给不竭提高的机遇,并为迟钝、不成靠、常常不公允的高利害评估供给解决方案。

英语讲授中人工智能主动评分的例子

在培生,咱们操纵人工智能技能开辟了一系列评估体系。

English Benchmark

English Benchmark也利用了主动评估技能。这个测试是在平板电脑长进行的,针对的是年青的进修者,采纳的是一种有趣的、雷同游戏的测试情势。本测评体系涵盖了听、说、读
看人工智能英语测评如何帮助老师和学生插图(1)
、写的技术,不但权衡学生的能力,并且对后续勾当和下一步讲授提出了建议。测评对标全世界英语程度测试尺度(简称GSE)和欧洲说话进修、讲授、评估配合参考框架(简称CEF或CEFR)。

PTE少儿英语测评

采纳怪异阅卷方法(E-PEN)快速高效地评阅每张测评卷,确保了评分的正确及公道。听、说、读、写四种能力的测评合适全世界英语程度测试尺度(简称GSE)和欧洲说话进修、讲授、评估配合参考框架(简称CEF或CEFR)的尺度。

Versant测试

Versant测试是帮忙任何黉舍、组织或企业创建说话能力基准的好东西。是专门设计的分级测验,用觉得进修者肯定得当的程度。

节选自文章 “Can a computer really mark an exam? The benefits of automated assessment in ELT”,作者Rose Clesham (培生团体学术尺度和丈量主任),原文公布于english.com。

Rose Clesham

培生团体学术尺度和丈量主任

带领培生团体评估设计和钻研团队,举行国度和国际校准和基准钻研,并在重要国际集会上讲话。Rose还遍及介入了经合组织的PISA评估,介入编写了2015年科学素养框架。

Rose具有剑桥大学构成性和闭幕性评估硕士学位和教诲评估博士学位。她是欧洲教诲评估协会(AEA-E)的成员,也是伦敦大学学院(UCL)的成员。

关于英语测评解决方案及其在海内的落地组织流程和相干办事,请存眷咱们近期相干主题的在线讲座。

关于作者: admin

热门文章