当前位置:首页  新闻动态

    学生培养 | 教心系郑蝉金副教授课题组学生在第二届社会科学量化研究方法青年学者论坛作报告
     发布时间:2024-10-09 浏览次数:10

    2024年7月,第二届社会科学量化研究方法青年学者论坛在贵州师范大学举行。教心系郑蝉金副教授课题组研究生徐培毅、史浩然,课题组李瑞佳、虞增艺同学参加会议并作报告。

           本次论坛的主题是“AI时代的社会科学量化研究方法”。AI时代的到来将极大的重塑社会科学研究形态,也为社会科学研究方法的发展带来了挑战和机遇。本次会议面向全国社会科学各学科领域征文,重点探讨AI时代量化研究方法的新趋势。大会将邀请心理学、社会学、管理学、护理学等领域的重量级学者做大会报告,并举办相关方法学前沿工作坊。论坛致力于为社会科学各领域学者提供量化方法共享、共育、共繁荣的跨学科交流平台。


    徐培毅

    指导教师:郑蝉金

    题目:基于iStEM算法的MIRT迫选模型估计适用性及标准误研究

    高利害情境下,人格测验常采用迫选式量表的形式以解决社会赞许性问题。在迫选领域中,MIRT(Multidimensional Item Response Theory)模型的应用已成为数据分析的标准方法,然而现存的参数估计算法普遍存在一些问题,因此当务之急是找到高维情景下高效而又准确的参数估计算法。iStEM(improved Stochastic Expectation-Maximization)算法由于其兼具准确和高效的优点逐渐受到青睐,但它目前无法实现标准误(Standard error,SE)的计算,因此需要补充该功能。因此,本研究旨在为iStEM算法提供标准误的计算功能,从而克服现有算法的局限性,增强其在高维迫选模型中的应用潜力。

    本研究提供了六种SE的估计方法,包括自助法、经验交叉积法、完整信息函数法等,显著提升了iStEM算法量化参数估计准确性的能力。同样通过模拟研究探究了不同种类计算方法在不同情境下的估计准确性,模拟研究选取了样本量等六个自变量。结果显示,在参数估计结果准确性良好的前提下,所有SE估计方法均拥有良好的准确性。实证研究将改进后的iStEM算法应用于24维的MAP职业性格测验3.0中,使用大规模真实数据集验证了其在实际情境中的适用性及SE估计的准确性。


    史浩然

    指导教师:郑蝉金

    题目:大型高维高利害迫选人格量表MAP的开发与应用

    人格测验作为一种有效了解求职者及员工的个性的方式,广泛应用于组织管理以及人才选拔与考核中。传统的人格测验量表大多为李克特式量表,其作答结果容易受到社会赞许性的影响,也更容易作假。为了克服这一局限,研究者提出了迫选式量表。然而,目前广泛使用的迫选量表大多源自国外,仍需开发可以用于职业测评的适合中国文化的迫选式人格量表。本研究创制了适合中国人群的迫选式人格量表:MAP迫选式人格量表。新量表能够减少社会赞许性带来的偏差,也更适合中国背景下的职业测评应用。

    MAP迫选式人格测验包3个人格层次下的24个人格维度,其作答采用RANK格式。该量表从最初开发的1.0版本,31个维度,155道题,在多次迭代后来到3.0版本,24个维度,88道题,有效减少了题目数量,使作答者不易作答疲倦。且在此过程中计分模型从传统测量理论转变多维项目反应理论(MIRT),解决了迫选式量表中自模式数据的问题。MAP3.0量表的开发过程包括了确定反应模型、出题及试测、题目筛选、称许性评定、题块数量确定、量表制定等步骤。

    在信效度分析方面,MAP3.0在内部一致性、重测信度和测量标准误的方面考察了量表的信度,在与经典量表的聚合和分歧效度和对工作绩效、面试成绩以及无领导小组讨论成绩方面的预测效度考察了量表的效度。

    综上所述,MAP迫选式人格量表的开发和应用为人格测试领域提供了一个中国适用的测量工具。随着进一步的研究和优化,MAP量表有望在人力资源管理领域发挥更大的作用。


    李瑞佳

    指导教师:郑蝉金

    题目:An Al-driven Agent approach to item automated generation

    本研究探讨了利用人工智能代理自动生成测试题目的方法,以解决传统题目的非重复使用性和更新难题。针对手动创建题目的低效性,研究提出了一种基于多代理系统的解决方案,该方案通过整合大型语言模型和外部知识库,优化了题目生成的逻辑推理和知识密集型任务的处理。

    研究基于ReAct框架,即推理加行动,将代理的行动空间与语言空间结合,并通过观察和反思步骤引入强化学习,以提升逻辑推理能力。提出的多代理系统包括领域代理、问题生成代理、问题解决代理和选项生成代理,各模块协同工作,确保生成的数学选择题具有质量保证和现实适用性。

    通过专家评分和统计分析,验证了该系统生成题目的有效性,结果显示其与真实题目在多个维度上具有可比性,且在某些方面优于直接由大型语言模型生成的题目。这一发现表明,多代理系统在提升题目科学性和准确性方面具有显著优势,能够减轻教育工作者的负担,并提升题库质量。

    研究还对比了不同多代理实施方法的成本和效果,为未来研究提供了实施参考。展望未来,该方法有望扩展至更多学科和题型,进一步集成难度控制和增强检索机制,以实现更广泛的应用。


    虞增艺

    指导教师:郑蝉金

    题目:AI-Driven Assessment of creativity in Students’Artworks

    艺术创作评估在培养学生创造力和艺术素养中起着关键作用。然而,传统评估方法常耗时且依赖教师主观判断,容易导致评估不一致和教师负担过重。为解决这一问题,本文提出了一种基于人工智能(AI)驱动的艺术评估框架,结合大规模语言模型和机器学习技术,提升小学绘画作品评估的客观性与效率。框架通过多维度指标对学生创作进行量化评估,包括现实变形、想象力、色彩丰富性、线条组合等。研究一开始尝试使用few-shot学习技术,对每个维度进行初步打分。通过为大规模语言模型提供少量人工评估的作品示例,模型能够学习有效的评估模式,生成各维度的评分与评价文本。这种方法减少了训练数据需求,并提升了模型在少量标注条件下的泛化能力。

    针对效果不理想的维度,再采用机器学习等技术进行优化评估,以提升其准确性和一致性。为验证方法的有效性,本文设计了剥离实验,评估AI组件在提升评估准确性与客观性方面的作用。此外,实地测试将在杭州小学开展,以验证AI评估系统对教师负担、评估效率及学生学习效果的影响。研究表明,AI评估系统可减少教师重复性劳动,提升教学互动与创意激发,为未来艺术教育评估提供新思路与实践方法。


    教心系研究生培养举措

    我系积极倡导学生了解本学科的前沿动态,拓宽学术视野,激发学术思维,鼓励学术交流,致力于培养具有国际竞争力的拔尖创新人才。


    01.课程建设

    在课程建设上,培养学生扎实的科研素养与跨学科研究能力,促使学生在课堂了解最前沿的科学研究,着重方法学的系统训练,为实证研究打下坚实基础。


    02.科研训练

    在科研训练上,以学生为中心,选择1-2两名导师形成导师组,为学生提供多元的科研交流平台,立足教育现实、聚焦学习发展,以科研创新促进学科发展。


    03.国际视野

    在国际视野上,对标国际高水平大学与科研机构,对话国际专家,聚焦前瞻性研究课题,鼓励学生参加重要国际学术会议,培养学生国际化视野。












    联系我们
    华东师范大学教育心理学系
    地址: 上海市普陀区中山北路3663号 
    邮政编码: 200062
    联系电话: 021-62233078
    电子邮件:depecnu@163.com
    百度地图API自定义地图
    版权所有 2018 华东师范大学教育心理学系技术支持: 上海屹超