克日,香港科技大学的一场特别测验测验考试引发了遍及存眷。张军传授和孟子立传授团队操纵一副搭载了ChatGPT-5.2大说话模子的乐奇Rokid AI眼镜,胜利实现了该校《计较机收集道理》课程的期末测验。在仅耗时30分钟的答题进程中,这台AI设备交出了一份得分92.5分的答卷,这一成就超出了95%的同期人类考生。
为确保测验考试的有用性,研讨团队完全复刻了实在测验的场景与环境。他们挑选了硬件开辟自在度较高的乐奇Rokid AI眼镜作为载体,并为其设备在呼应速率与常识储蓄方面均属顶尖的ChatGPT-5.2模子。在测验中,AI眼镜经由进程内置摄像头拍摄试题,将图象信息传输给后端的大模子停止处置。大模子在均匀0.8秒内便可实现标题题目推理并天生谜底,随后谜底被反向回显到眼镜的镜片上,供操纵者抄写。

终究的答题表现相称亮眼:在面临挑选题和单页短答题时,AI取得了满分;固然在触及跨页信息的逻辑推理题上出现了纤细的计较误差,但其谜底在全体推理的联贯性与解题步骤的完全性方面,均远超大大都先生。
这一测验考试成果并非偶尔。此前,英国雷丁大学的一项研讨也曾标明,在提交的AI天生答卷中,有高达94%能够或许经由进程野生考核,并且其均匀成就遍及高于实在先生的答卷。
这次测验考试更深层的意思,在于锋利地揭露了以后传统讲授评价体系中的一个焦点抵触:以考核常识点影象和规范解题步骤推导为主的面试情势,恰好是野生智能最为善于的范畴。当机械在“提交规范谜底”方面表现得比人类更超卓时,传统测验所承载的权衡与辨别意思便被极大地减弱了。
面临来自野生智能的打击,环球规模内的高档教导机构已起头主动追求鼎新途径。比方,纽约大学推出了AI面试体系,经由进程延续诘问先生的推演思绪来评价其实在懂得深度;局部院校则引入了须要展现进程的名目式功课与现场辩论,请求先生详细诠释本身的决议计划根据与思虑逻辑。另外,也有教导机构测验考试接纳“进程性档案袋”的评价体例,完全记实先生从提出题目到终究解题的全部思惟轨迹,从而将评价的重点从纯真的“成果准确性”转向对“思虑进程品质”的考查。




























