(3/5) 高效学习的间隔重复——文献综述之间隔效应

(3/5) 高效学习的间隔重复——文献综述之间隔效应

总目录:

  1. 概述:zhuanlan.zhihu.com/p/42
  2. 文献综述
    1. 测试效应:zhuanlan.zhihu.com/p/42
    2. 间隔效应(现在在这儿)
  3. 应用指南:zhuanlan.zhihu.com/p/42
  4. 脚注:zhuanlan.zhihu.com/p/45

间隔效应(分散练习)


测试的时机至关重要。上文中,我们注意到学完知识之后测试是有些好处,但是同样数量的测试分散到不同时机进行,更能实现间隔效应或者间隔重复。有上百个研究涉及间隔效应:


他们几乎一致地发现,若最终测试/测量在几天或几年后进行的话,间隔测试优于集中测试[30]⁠,尽管其中机制并未知晓[31⁠]。除了前面提到的研究外,我们还有:


大量研究文献都在探究“什么样”的间隔安排是最好的,以及如此安排所反映出的记忆性质:是间隔固定不动好,还是间隔逐渐变大好?这对于理解记忆以及建立记忆模型都非常重要,同时也有助于将间隔重复融入课堂(比如Kelley & Whatson 2013年研究使用的安排是10分钟学习/10分钟休息,将同样材料重复三次,其意图是促使材料进入长期记忆?)但是对于实践来说,这个研究方向不是很有趣:总的来说,很多研究众说纷纭,但给出的安排效率虽有差异,也不算显著。大多数现存材料都模仿 Supermemo, 使用了间隔变大的算法,所以没什么好担心的; Mnemosyne 的开发者 Peter Bienstman 说,尚不清楚更复杂的算法能否有助益[32]⁠, Anki 开发者担心重新实现 Supermemo 的专有算法太难也太复杂,却看不到显著成效,同时 SM3+ 算法为了极尽优化可能造成更多错误。所以他们也有同感。


如果有人感兴趣,有 3 项研究发现固定间隔比递增间隔更好:

  1. Carpenter, S. K., & DeLosh, E. L. (2005). “Application of the testing and spacing effects to name learning”⁠. Applied Cognitive Psychology, 19, 619-636[33]
  2. Logan, J. M. (2004). Spaced and expanded retrieval effects in younger and older adults. Unpublished doctoral dissertation, Washington University, St. Louis, MO

    这篇论文很有趣,因为洛根发现,一天之后测试,使用递增间隔复习的年轻人表现要差得多。

  3. Karpicke & Roediger, 2006a


撇开固定间隔的问题与递增间隔的问题不谈,有更多通用研究指出间隔学习相对集中学习的好处,见下面的列表:

培训后立即进行测试,结果间隔组(70% 正确)比集中组(53% 正确)表现更好。这些结果似乎表明,间隔效应适用于学龄儿童,至少适用于学校通常教授的一些材料。[35]
根据多诺万和拉多塞维奇对间隔学习研究的元分析,间隔效应的效应量d = 0.42. 这意味着接受间隔练习后的平均记忆效果,优于约 67% 集中练习者的记忆效果。这个效应量不容小觑——在教育研究中,即使效应量低到 d = 0.2 都认为是“足够显著”,而高于 d = 1 的效应量则少之又少。[36]

例如,在 Donovan 和 Radosevich (1999) 的一项元分析中,随着任务的概念难度从低(如旋转追视)到平均(例如单词列表回忆)再到高(例如拼图),间隔效应的效应量急剧减少。根据这一发现,对于许多数学任务来说,间隔练习的好处可能会变得微不足道。[37]

(注:旋转追视是用于测试手眼协调和运动技能学习的测试,受试者需要用指示物追踪旋转圆盘上的圆点)

Donovan 的元分析指出,在使用更好方法的研究中,效应量虽然变小,但仍然不容小觑。

  • Bahrick, Harry P; Phelphs, Elizabeth. “Retention of Spanish vocabulary over 8 years”⁠. Journal of Experimental Psychology: Learning, Memory, & Cognition. Vol 13(2) April 1987, 344-349; 这篇研究初始训练之后的间隔特别长,很有意思
Harry Bahrick 和 Elizabeth Phelps (1987) 研究了 50 个西班牙语词汇在 8 年之后的保留情况。受试者被分成三组。每个人练习七到八次,间隔几分钟,1 天或 30 天。在每个环节中,受试者都会进行练习,直到他们可以一次性完美回忆出单词列表…8 年后,无延迟组的人能记住 6% 的单词,延迟 1 天组的人能记住 8% ,30 天组的人平均能记住 15%。每个人都参加了选择题测试,其中再次观察到了间隔效应。无延迟组得分为 71%,一天组得分为 80%,30 天组得分为 83%。

…Bahrick 和他的同事们改变了练习的间隔和练习量。练习环节之间有间隔 14 天、28 天或 56 天的,总共进行 13 或 26 次练习。他们测试了受试者在训练后一年、二年、三年和五年的记忆。有一次观察到,当练习环节间隔较长时,在每个练习环节中达到标准所需的时间稍长一些,但同样,这一小投资在几年后产生了回报。测试是在练习后一年、两年、三年还是五年进行的并不重要——56 天组总是记住最多的,28 天组次之,14 天组记忆最少。而且影响是比较大的。如果每 14 天练习一次单词,你需要的练习次数是每 56 天练习一次时的两倍,才能达到同样的表现水平!

间隔效应的通用性

我们已经看到,间隔重复在各种学术领域和媒介上都是有效的。除此之外,间隔效应还在下列领域有效:

  • 各种「领域(例如,学习知觉运动任务或者单词表)」[42]比如空间记忆[43]
  • 「跨物种 (例如,老鼠⁠,鸽子和人类[或苍蝇大黄蜂⁠,和海蛞蝓,Carew et al 1972 & Sutton et al 2002])」
  • 「跨年龄组[婴儿期[44]⁠,儿童期[45⁠],成年期[46]⁠,老年期[47]]和具有不同记忆障碍的人」
  • 「以及跨保留间隔,从秒[48][到天[49]]到月」(我们已经看到以年为单位的研究)


然而,生效的领域是有限的。Cepeda et al 2006:

[Moss 1995,回顾了 120 篇文章]得出的结论是,较长的 ISI 有助于学习言语型信息(例如拼写[50])和运动技能(例如镜画实验);在每种情况下,超过 80% 的研究都显示出分散练习有效果。相比之下,只有三分之一的智力技能(例如,数学计算)研究显示分散练习有效果,一半的研究显示分散练习没有效果。(注:镜画实验是指实验时,被试注视平面镜内的图形。用描绘笔学习画下画板上的图形)

…[Donovan 和 Radosevich (1999)] 低严格性研究中的低复杂性任务(如旋转追视、打字和翻转钉子)效应量最大,并且保留间隔不影响效应量。Donovan 和 Radosevich 只研究了 ISI 和任务领域之间的互相影响。值得注意的是,任务领域降低了分散练习的效果;根据任务领域和间隔的不同,ISI 的增加要么增加了效应量,要么降低了效应量。总体而言,Donovan 和 Radosevich 发现,间隔更长的分散练习在自由回忆、外语和言语辨别等言语型任务中产生的效应量更大,但这些任务也显示出反 U 函数,即非常长的间隔产生的效应量较小。相比之下,打字、体操和音乐表演等技能型任务中,递增间隔的效应量较小。


从体操和音乐表演等技能可以看出,测试效应和间隔重复有一个重要特点:两者只能维持记忆强度或技能水平的现状,而无法令其进一步提升。如果有人开始复习时是有小有水准的业余爱好者,那么复习之后,他仍然只是小有水准的业余爱好者。Ericsson 介绍了「提升」和精进所专所必需的概念:刻意练习[51⁠]。摘自「刻意练习的作用」

有种观点认为,只要进行足够练习——无论练习组成如何——便能得到上佳表现。这个观点由来已久,也争议颇多。Bryan 和 Harter 在一系列针对摩尔斯电码操作员的经典研究(1897, 1899) 中,注意到技能习得存在平台期,也就是技能练习者很长一段时间内似乎无法进一步提升。然而,长久努力之后,练习者将能重组其技能,跨越平台期……面对继续精进的需求,即使是极富经验的摩尔斯电码操作员,经由刻意练习也能备受鼓舞,大幅提升其表现。对于更一般的领域, Thorndike (1921) 观察到很多成年人即使常常执行一些任务,他们在这些任务上的表现远称不上个人最佳水平。比如,一些成年人写字明明能写得又快又清楚,他们平常却没有这个水准。……对于[优化学习和提高成绩],有一个前提条件广为提及,也就是练习者须有动机执行此项任务……练习者需能当即获知详尽反馈,以及练习结果……缺乏足够反馈,高效学习无从谈起。即便练习者干劲十足,进步也微乎其微,尤其是准确性上……与游戏相比,刻意练习 是高度结构化的,其目标明确,就是提升表现。刻意练习中会制定具体的任务来克服缺点,并会仔细监控表现,来找出进一步提升的线索。我们认为刻意练习需要投入努力,其本质不是令人愉快的。


运动技能


应该指出的是,关于间隔重复多大程度上适用于运动技能,不少综述相互矛盾;Lee & Genovese 1988 认为有好处,而 Adams 1987 和更早的综述相反。区别可能在于,Shea & Morgan 1979 显示了(随机/间隔安排计划有益于)简单的运动任务,而 Wulf & Shea 2002⁠ 显示复杂的任务,即受试者已经在他的极限下操作的任务,则没有受益。Stambaugh 2009 提到了一些不同的研究:

情景干扰假说(Shea 和 Morgan 1979,Battig 1966 [技能的习得中的「促进和干扰」])预测阻塞条件将在练习(习得)后立即展现出更好的表现,但随机条件在延迟保留率测试中表现更好。这一假设在实验室运动学习研究中基本一致(如 Lee & Magill 1983, Brady 2004),但在运动技能的应用研究方面不太一致(结果好坏都有,如 Landin & Hebert 1997, Hall et al 1994, Regal 2013)和精细运动技能(Ollis et al 2005, Ste-Marie et al 2004)。


一些支持间隔重复的研究(摘自 Son & Simon 2012):

可能甚至在认知研究和间隔效应的实证工作之前,间隔学习的好处已经在一系列运动学习任务中显现出来,包括迷宫学习(Culler 1912 )、打字(Pyle 1915 )、射箭(Lashley 1915 )和投掷标枪(Murphy 1916 );(见 Ruch 1928 对从间隔学习中获益的运动学习任务进行了更广泛的回顾;也见 Moss 1996 关于运动学习任务的最新综述)。因此,与认知文献一样,运动领域的分散练习研究早已确立(见 Adams 1987 综述;Schmidt & Lee 2005 综述),大多数兴趣都集中在改变运动技能的学习试验的间隔对学习和练习技能的保留率的影响。Lee & Genovese 1988 对有关分散练习的研究进行了综述和元分析,他们得出的结论是,大量练习往往会抑制即时表现和学习,而学习是在练习环节之后的某个时间段内被评估的。他们的主要发现是,和认知文献一样,间隔练习后的学习比集中练习后的学习相对更强(但这里也有些批评:见 Ammons 1988 ;Christina & Shea 1988 ;Newell et al. 1988)......最广泛引用的例子可能是 Baddeley & Longman 1978 关于如何最佳地教邮递员打字的研究。他们让学习者每天练习一次或两次,每次练习的时间长度为 1 或 2 小时。研究的主要结果是,当学习者处于最分散的练习状态时,他们用最少的累计练习时间就能达到打字的表现标准。这一发现为间隔练习对加强学习的好处提供了明确的证据。然而,正如人们所指出的(Newell et al. 1988;Lee & Wishart 2005),还需要考虑的是,从开始练习到达到标准的总时间(天数)在最分散的条件下要长很多....同样的基本结果在此后的几十年里被反复证明(见 Magill & Hall 1990 综述;Lee & Simon 2004),并且在各种各样的运动任务中,包括不同的羽毛球发球(Goode & Magill 1986年),步枪射击(Boyce & Del Rey 1990),预先建立的技能,棒球击球(Hall et al. 1994),学习不同的逻辑门配置(Carlson et al. 1989; Carlson & Yaure 1990),自动取款机的新用户学习(Jamieson & Rogers 2000),以及解决课堂作业中可能出现的数学问题(Rohrer & Taylor 2007; Le Blanc & Simon 2008; Taylor & Rohrer 2010)。


在这一点上,有趣的是注意到交错可能对有心理成分的任务也有帮助:根据 Hatala et al 2003⁠,Helsdingen et al 2011⁠,Huang et al 2013,XBOX光环:Reach视频游戏玩家在技能比赛中的进步率从分布中很好地预测了:每周玩 4-8 场比赛的玩家,在每场比赛的技能进步,高于玩更多(分散)的玩家 ;但每周的进步速度低于打更多(集中)的比赛的玩家 。(另见 Stafford & Haasnoot 2016⁠.)


摘要


另一个可能的反对意见[52]是,间隔重复从本质上阻碍了各种抽象学习和思考,因为相关的材料没有放在一起回顾——从而能比较、推理——而是分散到几天或几个月的间隔。Ernst A.Rothkopf 说:「间隔是回忆的朋友,却是归纳的敌人」(Kornell & Bjork, 2008, p. 585)。根据一些早期的研究[53],这似乎是合理的,但我知道的最近的 4 个研究都直接检验了这个问题,这些研究都发现间隔重复有助于抽象和一般回忆:

  1. Kornell & Bjork 2008a, “Learning concepts and categories: Is spacing the ‘enemy of induction’?” Psychological Science, 19, 585-592
  2. Vlach, H. A., Sandhofer, C. M., & Kornell, N. (2008). “The spacing effect in children’s memory and category induction”⁠. Cognition, 109, 163-167
  3. Kenney 2009. “The Spacing Effect in Inductive Learning”
  4. Kornell, N., Castel, A. D., Eich, T. S., & Bjork, R. A. (2010). “Spacing as the friend of both memory and induction in younger and older adults”⁠. Psychology and Aging, 25, 498-503
  5. Zulkiply et al 2011
  6. Vlach & Sandhofer 2012, “Distributing Learning Over Time: The Spacing Effect in Children’s Acquisition and Generalization of Science Concepts”⁠, Child Development
  7. Zulkiply 2012, “The spacing effect in inductive learning”⁠; 其中包括:
    1. Kornell & Bjork 2008 研究的复现
    2. Zulkiply et al 2011
    3. Zulkiply & Burt 2012, “The exemplar interleaving effect in inductive learning: Moderation by the difficulty of category discriminations”
    4. 目前在同行评议中不出名的论文
  8. McDanie et al 2013, “Effects of Spaced versus Massed Training in Function Learning”
  9. Verkoeijen & Bouwmeester 2014, “Is spacing really the ‘friend of induction’?”
  10. Rohrer et al 2014: 1⁠, 2⁠; Rorher et al 2019: “A randomized controlled trial of interleaved mathematics practice”
  11. Vlach et al 2014, “Equal spacing and expanding schedules in children’s categorization and generalization”
  12. Gluckman et al, “Spacing Simultaneously Promotes Multiple Forms of Learning in Children’s Science Curriculum”

综述摘要

总结要旨就是:

  • 测试是有效的,其负面因素也可以忽略

  • 递增间隔大致与(长)固定间隔效用上基本相同,甚至更好,但递增更省事,而且是默认设置

  • 测试(以及间隔)对于智力性、偏重使用事实与语言的领域非常有效,但在许多低级领域可能仍然有效

  • 这项研究偏好那些强制用户尽可能多地调用记忆的问题,现将这些问题按偏好程度降序排列如下:
  1. 自由回忆
  2. 简短回答
  3. 选择题
  4. 填空题
  5. 再认


  • 研究文献很全面了,大多数问题都已经得到了回答——相信你能找到。

  • 间隔重复最常见的错误是
  1. 编写糟糕的问题和答案

  2. 认为间隔重复有助于学习新知,而非维护保持已学内容[54]⁠, (很难从卡片学知识,但如果你已经学到知识了,那么设计抽认卡来测试弱点就容易多了)



下一部分:应用指南

编辑于 2022-01-05 09:01