这是 Yuze He, Wanqi Yang, Yonghe Zheng, Yuqing Chen, Wenke Liu, Jingying Wang 发表在 2024 年 12 月《The Physics Teacher》的一篇论文。
学生在理解抽象的物理概念和原理时经常遇到困难。物理图像在促进学生理解方面发挥着重要的作用。智能手机上的传感器可以测量光、磁场和声音,将抽象的物理概念转化为图形。但由于这些图形包含隐含信息,需要学生具备很强的图形理解能力。大语言模型 (LLM) 作为一种有前途的工具,可以将其应用在物理课堂上,以帮助学生理解图像。
这篇论文阐述了在物理课堂上,(1) 使用智能手机进行实验并收集声音图形;(2) 在 LLMs 的指导下解释收集到的声音图形。通过与 LLM 互动,学生可以获得即时解释,从而加深对物理概念的理解。
图1表示声音信号的波形,图 2 是用手机收集音叉产生的信号。
当学生得到声音图形后,在智能手机-相册直接上传声音图形至LLM中,这里使用的是 讯飞星火 大预言模型——可以同时分析多个图表,如图3-4 所示。
当学生以最简单的提示方式要求讯飞星火 “请分析这张图片 ”时,讯飞星火 会生成对有关图表的回复,回复如图 4(b) 所示。在回答有关图表的问题时,LLM 表现得非常熟练,能够描述了坐标轴名称、坐标值范围和包含的曲线。不过,与其他 LLM 一样,回答也会包含一些错误(X 轴和 Y 轴混淆了),但这并不影响对图形的整体解释。
文章认为有两种方法可以有效减少 LLM 产生错误回答和冗余:一种是教师需要在课前使用大语言模型(LLM)进行练习,利用模型解读图像或文本等素材,不断改进提示词,直到获得最佳结果。第二种是教师在课前训练一个“代理模型”(Agent),该模型基于特定指令进行训练,以便更精准地完成任务或提供解答。
原文链接: https://doi.org/10.1119/5.0229741