数据驱动的在线学习者行为的无监督聚类外文翻译资料

 2023-01-08 03:01

数据驱动的在线学习者行为的无监督聚类

原文作者 Robert L. Peach 单位 伦敦帝国理工学院数学系

原作:Sophia N. Yaliraki 单位:伦敦帝国理工学院化学系

原作:David Lefevre 单位:伦敦帝国理工学院商学院

原作:Mauricio Barahona 单位:伦敦帝国理工学院数学系

摘要:在线课程的广泛应用为分析学习者行为和优化基于网络的学习以适应观察到的使用提供了机会。在这里,我们引入了一个数学框架来分析在线学习者参与的时间序列,该框架允许直接从原始数据识别具有类似在线时间行为的学习者集群,而没有规定先验的主观参考行为。该方法利用动态时间扭曲核在学习者动作的时间序列之间建立成对的相似性,并结合无监督多尺度图聚类算法来识别具有相似时间行为的学习者群体。为了展示我们的方法,我们分析了帝国商学院(Imperial Business School)在线研究生学位学员的任务完成数据。我们的分析揭示了具有统计上不同参与模式的学习者群体,从分布式学习到集中学习,具有不同程度的规律性,遵守预先计划的课程结构和任务完成。该方法还揭示了具有高度分散行为的离群学习者。对学生成绩后验比较表明,而高性能学习者分布在集群不同时间接触,低表现显著位于集群集中学习,和我们的无监督聚类识别低表演者更准确地比常见的机器学习分类方法训练时间统计数据的最后,我们测试方法的适用性通过分析两个额外的数据集:同一课程的不同队列,不同格式的时间序列来自另一所大学。

关键词:学习者聚类; 在线学习; 聚类研究;

正文

介绍

近年来,随着在线学习平台的普及,数据分析在教育数据中的应用迅猛增长[1,]。然而,在获得更多详细信息的同时,确定正确的数据类型和分析方法也是至关重要的,这将允许我们获得在线参与和学习模式的可解释的见解[2,]。学习的过程是随时间而扩展的,因此时间数据的分析是教育数据分析的一个重要焦点。在这项工作中,我们描述了一种研究时间序列数据的方法,收集了学习者与在线课程的任务和阶段的参与。时间统计分析已经被证明提供了一个富有成效的方法来识别有失败风险的学习者[3,],预测表现[4,],辍学[5,6,7,8,],或识别学习者行为[9,]。尽管有这些发展,最近一个对该领域的回顾表明,时间分析目前在数量上是不够的,需要更多的方法[10,]。

时间分析已被用于教育背景下调查大规模与分布式研究模式,即。,比较那些把学习材料“集中”(或“填鸭式”)到一个学习阶段的学习者和那些把学习材料“分散”到几个较短学习阶段的学习者的表现。一般的结论是分布式实践是更有效的策略[11,]。这种“间隔效应”[12,]已经在不同的时期和不同的背景下得到了证明[13,],尽管其他的报告指出这种效应并不适用于所有的学习背景[14,]。然而,以往数据分析的一个特点是,他们通常提前将受试者分配到两种预先确定的研究模式中的一种。事实上,在监督机器学习方法中,预先分配也是一种内在的限制,在这种方法中,预先分配标签来训练算法。

最近的研究收集了学习者行为的时间序列,并根据预先选择的数据特征(如任务焦点、资源使用等)对学习者进行聚类,选择这些特征来描述解决问题的不同方法。然而,这种方法高度依赖于选择作为描述符的时间特征(基于数据的特定知识)和聚类所获得的组的数量。例如,最近的一项研究提取了混合课程的学习者的特定特征。,并确定了四个行为组,根据他们在两个平台上的不同参与程度来区分[15,]。这些研究举例说明了时间分析和聚类分析的结合如何能够为教育工作者、课程设计者和学习分析研究者提供有用的见解[10,16,]。

在这里,我们提出一个无监督的方法,允许原始时间序列的直接分析收集的订婚的学习者完成任务没有施加先验的在线课程时间序列的统计描述符和学习者的数量或类型的组被检测出来。因此,所获得的学习者集群并不是基于先验特征预先确定或主观识别的,而是在数据分析过程中通过算法检测得到的。为了举例说明我们的方法,我们详细地分析了时间序列。81名学员参加了6门在线必修课程,这6门课程是两年制在职研究生管理学位课程的第一年。课程延长超过三个学期,任务完成的模式在不同的学习者群体中有很大的差异。图1显示了这类高度不同的时间序列的三个例子,展示了各种行为:从稳定的完成到高度集中的行为,再到零星的模式。强调它的适用性,我们也应用两个额外的数据集的方法:一组不同的时间序列任务完成来自相同的学位课程,但从不同的队列,和一组时间序列的在线交互(而不是完成任务)收集到一个不同的大学,因此具有不同的特征。

方法总结在图2中。我们使用来自每个学习者的原始的、有时间戳的在线动作序列,并使用动态时间扭曲(DTW)内核[17,]来计算所有对学习者时间序列之间的相似性得分。尽管存在一些替代方法来衡量两个时间序列之间的相似性(如欧氏距离、傅里叶系数、自回归模型、编辑距离,或最小跳跃模型)(18日),DTW已啤酒证明超越各种措施分类任务(19日),提供了一个使用完整的原则方法,原始信息的时间序列没有预选特性或功能表征[20]。从DTW相似度矩阵出发,构造了一个相似度图,其中节点为学习者,加权链接表示学习者之间的相似度。这个图的构造步骤是使用放宽的最小生成树算法[21,]来实现的,它的目的是封装数据集中局部强和全局相关的相似性。RMST与多尺度、无监督的Markov稳定性图划分方法相结合表现良好[22,23,],我们将其应用于我们的图,以获得具有相似时间行为的学习者集群。在其他上下文和应用中,已经提出了其他方法来对时间序列数据进行集群,包括创建图和不创建图[24,25,26,27,]。我们的算法没有找到一个特定的聚类,而是生成一个多尺度描述,由一组不同粗度的一致聚类给出,这些一致聚类是在无监督的情况下以鲁棒优化的方式跨所有分辨率级别获得的,没有预先设定聚类的数量或类型(参见图3A中的示例)。然后分析人员可以根据他们的需要使用不同粗度的集群。如果没有发现健壮的聚类,那么该算法将发出数据中缺少自然聚类的信号。理论分析的细节在方法部分中给出。

当应用到我们的案例研究数据集时,我们的分析确定了一组学习者在不同解决水平上的聚类。学习者的集群反映了他们通过在线课程进行学习时不同的时间投入。特别是,我们的数据驱动集群捕获与“集中”相关的行为。,在短时间内完成大量任务)和“分布式”学习,以及区分这些学习类型为子群体的更精细的行为。例如,粗略地说,该算法识别出一组以顺序和“分布式”方式学习课程的学习者;然而,在一个更精细的分辨率下,这个集群被细分为两个集群,它们在任务的平均完成时间上有1-2周的差异(即,“早起的鸟儿”和“准时的”)。我们的方法也发现了一些零散的学习者,他们会跳过大量的任务,或者表现出不规则的集中学习。对于其他两个数据集也观察到类似的结果,尽管反映数据特殊性的差异有所不同。然后,我们使用考试成绩后验来确定特定的在线参与行为是否会对学习者的学习表现产生负面影响,并根据时间序列数据计算出的统计特征将分组与分类进行比较。

图 1 三个示例学习者的任务完成时间序列

整个课程分为三个学期,每个学期完成两个模块。绘制整个队列学习者的平均任务完成轨迹(黑线)进行比较。学习者65(左,浅绿色)完成任务的时间总是早于平均水平,而学习者48(中,紫色线)倾向于在平均水平之后完成任务,特别是在学期3。学习者43(右图,深绿色)在第一和第二学期表现出相当分散的行为,许多任务都很晚才完成或在集中学习期间完成。

结果

无监督聚类揭示了具有不同在线参与度的学习者聚类。

为了以一种无监督的方式找到具有类似在线参与的学习者群体,我们遵循图2中总结的过程。我们首先使用动态时间扭曲核来创建学习者之间的相似性矩阵。使用基于松弛最小生成树的稀疏化方法将该矩阵转换为相似图[21,],这一过程保留了全局网络连接性,同时抛弃了可通过更长的强相似链解释的弱相似点。通过这个过程,我们创建了一个图,其中的节点是学习者链接的边缘加权根据他们的时间-过程相似性。因此,两个学习者以类似的方式完成课程的任务,将被一个强大的优势联系在一起。

然后使用马尔可夫稳定性(MS)分析构建的相似图,这是一种多尺度图分区算法,使用马尔可夫过程在马尔可夫时间内扫描图,以找到优化的和鲁棒的图在任何分辨率级别的分区[22,23,]。通过在所有分辨率级别上最大化与分辨率相关的成本函数(马尔可夫稳定性)来找到分区,如马尔可夫时间t所示。,在扩展的马尔可夫时间t上是最优的,由一个VI(t, t)值较低的平台给出,并且(ii)对优化的小变化具有鲁棒性(即,在这些尺度上一直被认为是一个很好的划分,如VI(t)的相对下降所给出的。这种健壮的划分可以识别出表现出类似在线时间模式的学习者集群。给出了不同测度的定义和马尔科夫稳定性框架的一些细节。

图3A总结了我们的多尺度聚类方法应用于81名在帝国理工商学院(Imperial College Business School)攻读研究生兼职管理学位的学员完成6门在线课程的时间序列的结果。有关数据的详细信息,请参见方法。随着马尔科夫时间的增加,分辨率降低,该方法具有粒度递减的鲁棒性。在图3A中,我们演示了从10个集群到2个集群的分区,其中一个分区非常健壮,分为6个集群。请注意,较细的集群与较粗的集群之间的准层次聚合,这是数据固有的特性,不是我们的集群算法强加的。(有关多尺度集群结构的更详细信息,请参见补充图1。)跨分辨率级别的准层次组织反映了这样一个事实:细微的时间细节描述了更精细的集群,而时间概要的更广泛的相似性定义了更粗糙的集群。因此,我们的计算框架允许可调粒度,可以根据分析人员的需要进行调整。

为了举例说明我们的数据集中结果的特征,我们主要关注6-cluster分区,它包含4个大组和两个单独的学习者,由于他们高度独立的零星行为,这些学习者仍然没有聚集在一起。6聚类分区在VI(t)中表现出最大的相对下降,在VI(t, trsquo;)中表现出一个较长的平稳期。10个集群和8个集群分区同样重要,它们提供了与6路分区一致的更精细的集群,如图3A所示。更粗糙的2-聚类划分也很有趣:这两个聚类用于将分散学习和集中学习的学习者分开。在本文的其余部分中,我们将重点讨论来自6个集群分区的更详细的行为描述,因为它提供了数据解析的细微差别和数据驱动级别。

图 2 时间序列聚类方法综述

(A)每个学习者的时间序列是根据他们在进行在线课程时与任务交互的时间戳编制的。(B)使用动态时间扭曲核(见方法)对每个学习时间序列进行两两比较[17],该核计算两个时间序列之间的相似性度量。(C)构造一个邻接矩阵A,其中每个元素Aij两两描述学习者i和j之间的相似性。相似性度量在0和1之间(从蓝色到红色),其中值越高表示相似性越高。(D)邻接矩阵A编码一个网络,其中每个边表示一个学习者,边表示每个学习者之间的相似性。群体检测可以根据学习者相似的时间序列行为对其进行聚类。

在线学习者簇群的特征

如图3B所示,6-cluster分区是健壮的,它提供的数据驱动分组具有适当的解析级别,可以深入了解在线学习者的观察模式。两个集群只包含一个学习者,具有高度的个体和零星的行为。对于其他四个聚类,我们使用高斯过程回归(GPR)[28]来计算这一组学习者的平均参与轨迹,并将其与整个81名学习者的平均GPR轨迹进行比较。计算出的GPRs允许我们使用过程的贝叶斯因子对不同集群的时间模式的差异进行统计量化。特别地,我们发现每个集群的轨迹在统计上更有可能来自于在它们自己的集群中定义的独立进程,如下所示。对整个轨迹集拟合了一个探地雷达,并计算了整个轨迹集的对数似然。同样地,从相同的高斯过程中计算出每个单独的轨迹群的对数似然。Bayes因子的计算结果是每个单独的集群的log概率之和减去整个轨迹集12的log概率,结果发现该因子很大(K = 3.37 x 1010)。这表明每个聚类的行为在统计上是不同的,并且是由不同的行为过程产生的。对于每对相邻集群之间的差异,重复进行此计算。Bayes因子在“早到者”和“准时者”之间为:K=0.38times;1010;K= 1.52times;1010之间的“on time”和“low engager”集群;和K = 0.17 x 1010之间的“低engager”和“crammers”集群。这些数字提供了所获得的聚类之间差异的统计证据。

这个分区中的每个集群都有一个描述性的标题,它封装了组行为。“早起鸟”组(绿色集群)的学习者通常表现出高度顺序和有序的学习方法,倾向于比队列平均提前1-2周完成任务。在“准时”组(青色组)中,学习者的行为与“早起的鸟儿”相似,只是他们完成的任务更接近平均水平。因此,绿色组和青色组都表现出类似的“分布式学习”行为,区别只在于轻微的延迟,这解释了为什么两个组在更粗的双向分区中聚集成单个集群(图3A)。“低engager”(橙色)组的学习者也表现出相对分散的工作流程(类似于青色和绿色组),但在下半年(特别是在第三学期)预期较少。此外,这一组有许多从未完成的任务。“抽筋”组(洋红色)包含了表现出大量学习的学习者(在他们的时间序列中出现了plateaux,表明任务在短时间内完成)、低任务完成和偏离所建议的课程顺序的任务完成顺序。最后,离群者(学习者43和46)形成他们自己的集群,表现出高度分散的学习行为,任务在较晚的日期完成,而没有遵循课程的布局顺序。

图 3 学习者集群的多尺度划分和特征

(4)利用马尔可夫稳定性(MS)对学习者相似图进行多尺度无监督分割。图中的节点为学习者(N = 81),节点之间的边根据时间任务完成之间的动态时间弯曲相似度1进行加权。我们获得quasi-hierarchy图分区增加粗糙度(数量的集

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[272100],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。