辽宁省招考办干系卖力人对南都强调,运用人工智能的紧张目标不是抓作弊,而是希望借此起到震慑浸染,让抱有侥幸生理的考生不敢、不能、不想作弊,营造更加公道、公正的考试环境。

让人工智能办理高考视频研判中的“痛点”

7月7日傍晚五点,交卷铃声响,辽宁省2020年高考第一天考试结束。

三个小时后,辽宁省招考办的近十位技能职员劳碌起来:当天的全部监考视频已被加密传输到云端数据库,考场违规行为检测随之开始。

揭秘辽宁高考AI反作弊系统170小时检测10万小时考场视频

办公室里没人说话,只能听见电脑主机运行发出的嗡嗡声。
每位技能职员都守着一台电脑,心神专注地盯着电脑屏幕上多少个整洁排列的程序窗口——他们没有敲击键盘或鼠标,程序窗口内却有一行行代码以肉眼险些看不清的速率飞快闪过。

AI检测系统的运行界面。

这些代码的背后,正是辽宁省今年首次引入高考的“考场违规行为智能剖析系统”。

通过研判监考视频排查考场违规行为,是各省市每年高考期间的例行事情。
但多年下来,辽宁省招考办也创造了一些“痛点”问题:投入人力多,大约须要100名以上的专业职员;花费韶光长,100多人也得看上7-10天,而且要等到高考正式结束后才能开展事情;事情内容呆板,每个监考视频的时长都在3小时以上,研判职员一贯盯着倍速播放的视频,很随意马虎涌现疲倦。
研判职员具有视觉局限性,且专注度和辨识能力不敷。

人类的短板,人工智能恰好可以补上:它具备自我学习能力,数据处理速率快,能7×24小时全自动运行。

辽宁省招考办数据部副部长刘健先容,今年辽宁共有7585个考场,天生监考视频3.3万个,视频总时长近11万小时。
人工智能系统配备了80台智能剖析做事器,每小时可以剖析320个完全的考场视频,仅用170个小时的韶光就完成了全部检测。

据理解,这170个小时,还包括视频文件的获取和存储所占用的韶光。
如果据此对系统的运行韶光做一个守旧的换算,80台智能剖析做事器同时事情,每检测一场考试视频的均匀用时大约是18秒。

“今年研判职员的任务轻松很多,由于前期人工智能系统已经把大量视频筛掉了。
各级考务事情职员只须对系统检测出来的疑似违规行为进一步甄别判断。
”刘健说,在防控新冠肺炎疫情的分外形势下,运用人工智能也避免了大量研判职员聚拢带来的潜在风险。

须要解释的是,系统检测出的非常行为,只能被称为“疑似违规行为”。
研发团队卖力人、沈阳航空航天算夜学教授、沈阳图为科技有限公司创始人石祥滨见告南都,考试违规的剖断是一个繁芜且谨慎的过程,系统给出的参考绩果要经由多轮人工核查,终极由各级考务职员剖断是否违规。

运行不到一小时就创造疑似违规视频

南都理解到,这套系统的构成相称繁芜,不仅是设计一个好的算法模型那么大略。
它包括视频文件预处理、任务智能调度、视频剖析、视频回放、业务管理和统计剖析六大模块。
前两个模块紧张是为了让系统高效运行。
代替人类“看视频”的事情,紧张集中在视频剖析和视频回放模块。
创造非常后,系统会将干系信息传输到业务管理模块,供事情职员调取和查看。

7月7日晚系统正式启动运行后,不到一个小时就创造了第一条考生行为非常视频。
疑似违规的两名考生,协同作弊,互对答案,并没有被监考老师创造。

两名考生没想到的是,他们的一举一动都被人工智能“尽收眼底”。
只要研判职员登录到业务管理模块,就可以一览无余地看到疑似违规情形。

高效、便捷,是研判职员的普遍感想熏染。
“去年研判时,分配给我们的是一堆原视频,每个视频的时长从3小时到3.5小时不等,每个都要从头看到尾。
每个考场里有30个旁边的考生,你想想视频画面里的人得有多小!
韶光没少花、累没少挨。
”一位参与过去年高考的研判职员说,有了人工智能系统,回看视频的总量一下子减少到原来的1/20,研判事情更有针对性,“事情效率太高了”。

据辽宁省招考办先容,今年创造的诸多疑似违规行为中,有部分被考务职员剖断为确实违规。
经由实际考验,系统能有效识别旁窥、前窥、转头、递纸条等常规性抄袭行为,在人工不易判断的高科技作弊行为检测方面也取得了较好的效果。

从特色提取到数据处理 研发过程历经重重寻衅

疑似违规行为是怎么被创造的?系统算法卖力人、沈阳航空航天算夜学副教授、沈阳图为科技有限公司核心成员刘翠微阐明说,团队通过研究大量的考试视频和生理学资料,创造有违规行为的学生多少会产生一些生理颠簸,进而表现出行为非常。
“通过剖析画面中考生的动态和静态特色,人工智能系统可以捕捉到一些非常行为。
”她说。

事理阐明看上去非常大略,真正的研发过程却艰辛而漫长。
辽宁省招考办早在2017年便故意利用人工智能,受技能水平限定没能实现——干系事情职员打仗了不少公司,包括一些互联网大厂,得到的答复都是“做不了”。
直到2018年,沈阳航空航天算夜学团队才接管了这个“寻衅”。

让人工智能练就“火眼金睛”,难在哪儿?刘翠微见告南都,违规行为的特色表示和提取,是第一大难题。

用人脸识别作为比拟,或许能更好地解释考场行为剖析的困难所在:每个人的人脸特色是确定的,机器只要拍到清晰的人脸图片,就可以完成特色提取和后台比对。

但在考场上,不同考生之间的差异性很大,违规行为的特色是不愿定的。
即便同样是打小抄,100个学生可能也会有100种不同的表现。
这就哀求研发职员明确违规行为的特色,让系统能够作出有效区分。

考生风雅动作的可辨识性,则是另一重难题。
由于现实条件限定,考场内不可能安装多个摄像头,只能靠教室前真个一个摄像头来俯拍全景,不同的考生之间可能涌现遮挡。
一个教室大约有30位考生,即便考场视频已达到高清级别,画面中的每位考生还是很小,被拍下来的身体姿态、动作也局限于特定的角度。

高考监控摄像头拍摄画面。

“一个想作弊的考生会有很强的主不雅观暗藏性,不可能把他的行为公然展现出来。
他的动作都是细微的动作,变革幅度非常小,反响到图像当中可能便是几十个像素乃至几个像素。
”刘翠微说,此前的一些人工智能系统可以检测幅度较大的快速运动,比如斗殴打斗、非常奔跑等。
但室底细况下的多人风雅行为剖析,仍旧面临较大寻衅。

构建高质量演习模型,也是研发团队要办理的一个主要问题。
技能职员组织专门军队对大量考试视频进行标注,包括视频中人的位置、身体部位、考生的动作、是否违规,等等。

此外,比较于人脸识别中的图像比对,视频剖析的难度更大,背后的数据处理事情完备是不同的量级:一样平常视频的播放帧速率是每秒24帧,也便是24张图像。
一场两个小时的考试,就会天生超过17万张图像。

要在这些图像的连续运动中创造考生特色的变革,同时让系统剖析的结果具有“可阐明性”,可谓是难上加难,国内外没有多少履历可以借鉴。
刘翠微回顾,研发事情曾多次陷入瓶颈,由于视频的数据量太大,他们有时候让系统运行一个测试,都要花上一两天之久。

终极,研发团队在完成核心技能攻关的根本上,授予了系统一系列易管理、易操作的特性:任务流程自动化,系统可对剖析结果自动筛选,一键天生工单发送给研判职员;管理职员可以实时监测所有任务的实行情形;视频模块可以自动截取证据视频片段,减轻复核事情量;可根据用户的不同需求,按照市、区、考点和科目等多维度进行数据统计和输出。

也正是由于多项事情属于“勇闯无人区”,研发团队目前已申请了11项发明专利,同时主持了一项辽宁省地方技能标准的制订。
为了让干系运用得到更好地发展,团队还孵化了沈阳图为科技有限公司,专攻视频领域的行为识别。

人工智能没有KPI 紧张目的是起到震慑浸染

从2018年研发启动到如今的运用落地,两年多的韶光过去了。
石祥滨坦言,当初接下事情的时候就知道寻衅很大,但还是没想到花了这么久。

由于系统的创新性较强,很多市情上现有的软件和设备无法知足需求,团队还开拓了一系列配套的软硬件。
例如,这次辽宁省招考办利用的80台视频剖析做事器,便是团队研发的软硬件协同一体机,更适宜用来实现视频识别。

在两年多的韶光里,系统曾在辽宁省的普通高考、高中学业水平考试、研究生入学考试、自学考试和成人高考等考试中进行试点实验,确认了实际效果之后,辽宁省招考办才决定在今年的普通高考中正式运用。

为了支配80台视频剖析做事器、让系统的马力能开到最大来知足高考的需求,辽宁省招考办还特意改造了机房,将做事器机柜底部的地板换成了透风地板,确保供电、温度等方面没有问题。

80台视频剖析做事器一起运行。

不过,从7月7日开始,石祥滨还是每天都要去一趟辽宁省招考办检说情形。
技能职员们也实施了“两班倒”,确保系统可以24小时不间断无端障运行。

“这么繁芜的一个别系,只要有一个环节出问题,就会影响后面的事情。
但高考是不许可出错的,我们要对考生卖力。
”石祥滨坦言,压力很大,每天看到系统正常运行才能安心。
目前来看,系统成功经受住了磨练。

值得把稳的是,刘健见告南都,智能系统并没有设定“抓多少个违规行为”的“KPI指标”。
“不是说抓到的违规考生越多就越好,更多地是要起到震慑的浸染,让考生清楚知道作弊必被抓,实现考生不敢、不能、不想作弊的目标,营造更加公道、公正的考试环境。
”刘健说。

近年来,人工智能的效用屡屡被党和政府提及。
去年底召开的党的十九届四中全会就曾提出,“更加重视利用人工智能、互联网、大数据等当代信息技能手段提升管理能力和管理当代化水平”。
今年确当局事情报告中也提到,加强新型根本举动步伐培植,发展新一代信息网络。
辽宁省招考办表示,未来希望将人工智能技能运用于招生考试事情的更多环节,如识别试卷保密室事情职员、智能评卷等,实现招考事情中的管理能力提升。

采写:南都冯群星 潘颖欣