(2/5) 高效学习的间隔重复——文献综述之测试效应

(2/5) 高效学习的间隔重复——文献综述之测试效应

总目录:

  1. 概述:zhuanlan.zhihu.com/p/42
  2. 文献综述
    1. 测试效应(现在在这儿)
    2. 间隔效应:zhuanlan.zhihu.com/p/42
  3. 应用指南:zhuanlan.zhihu.com/p/42
  4. 脚注:zhuanlan.zhihu.com/p/45

文献综述

但是不要轻信我的话——不随他人之言!要用科学说话。当然,如果你真的相信我的话,你可能只想阅读间隔重复的使用方法和各种花式应用,所以我建议你直接跳到这里(应用指南)。其他人,我们从头开始:

背景:测试有效果!


「把课文阅读二十遍之后背诵,效果不如把课文阅读十遍,并且时不时尝试背诵,记不住了就翻阅一下。」——The New OrganonFrancis Bacon


测试效应是广受承认的心理学现象,表明了单纯测试记忆的行为就会增强记忆(无论是否有反馈)。既然间隔重复的本质就是在特定的日子进行测试,我们便能得出测试比普通复习或者学习有更好的效果,而且不仅适用于记忆随便一个日期。下列是一些有关论文:

  1. Allen, G.A., Mahler, W.A., & Estes, W.K. (1969). “Effects of recall tests on long-term retention of paired associates”⁠. Journal of Verbal Learning and Verbal Behavior, 8, 463-470

    进行一次测试,一天之后的记忆强度相当于学习 5 次;与集中回顾相比,间隔可以提高保留率。

  2. Karpicke & Roediger (2003). “The Critical Importance of Retrieval for Learning”

    学习斯瓦希里语词汇的实验中,学生遵循不同的流程,有的接受测试,有的学习,有的两者都做;学习阶段各组得分相似。研究人员要求学生预测他们能记住的词汇所占比重 (所有小组的预测的平均值是 50%)。一周后,接受测试的学生记住了大约 80% 的词汇,而没有测试的学生记住了大约 35%。一些学生测试或学习的时长比其他学生更久,然而一旦记忆成型了,收益递减便如影随形。学生们报告说,他们很少测试自己,也很少测试已经学过的内容。

    总结:同样,与学习相比,测试可以改善记忆。而且,没有学生知道这一点。

  3. Roediger & Karpicke (2006a). “Test-Enhanced Learning: Taking Memory Tests Improves Long-Term Retention”

    学生在读完文章 5 分钟、2 天、1 周后就文章阅读理解接受考查(没有反馈)。5 分钟之后考查,学习材料完胜测试,但其他时刻后就不一样了;然而学生认为,无论何时接受考查,学习都胜过测试一筹。1 周之后,测试成绩为 60%,而学习为 40%。

    总结:与学习相比,测试更能改善记忆。所有人(老师&学生)“觉得”恰好相反。

  4. Karpicke & Roediger (2006a). “Expanding retrieval promotes short-term retention, but equal interval retrieval enhances long-term retention”

    一般科学散文理解;摘自 Roediger & Karpicke 2006b:「两天后,初次测试比重复学习的记忆效果更好 (68% 比 54%),一周后再观察,测试比重复学习仍有优势 (56% 比 42%)。」

  5. Roediger & Karpicke (2006b). “The Power of Testing Memory: Basic Research and Implications for Educational Practice”

    文献综述:有 7 项1941 年之前的研究证明测试可以提高保留率,而在 1941 年之后的研究也有 6 项。另见综述 “Spacing Learning Events Over Time: What the Research Says” & “Using spacing to enhance diverse forms of learning: Review of recent research and implications for instruction”⁠, Carpenter et al 2012。

  6. Agarwal et al 2008, “Examining the Testing Effect with Open- and Closed-Book Tests”

    与 #2 一样,从长远来看,更纯粹的测试形式(也就是开卷测试而非闭卷测试)表现得更好,学生对于哪种测试更有效果上是受蒙蔽的。

  7. Bangert-Drowns et al 1991. “Effects of frequent classroom testing”

    有 35 项研究在学期中展开各式测试。对这些研究进行元分析,发现 29 例发现测试有好处;5 例发现有坏处;1 例结果为无效果。元分析发现,即使只测试一次,也会带来巨大的好处,之后回报就会递减。

  8. Cook 2006, “Impact of self-assessment questions and learning styles in Web-based learning: a randomized, controlled, crossover trial”⁠;医生(住院医师)带着问题学习的话,最终得分更高。

  9. Johnson & Kiviniemi 2009, “The Effect of Online Chapter Quizzes on Exam Performance in an Undergraduate Social Psychology Course”(「这项研究考察了基于掌握学习理论的每周强制阅读测验对于提高考试和课程表现的有效程度。能完成阅读测验与更好的考试和课程表现有关。」);另见 McDaniel et al 2012⁠。

  10. Metsämuuronen 2013, “Effect of Repeated Testing on the Development of Secondary Language Proficiency”

  11. Meyer & Logan 2013, “Taking the Testing Effect Beyond the College Freshman: Benefits for Lifelong Learning”⁠; 证实测试效应在老年人中与年轻人有相近的效应量

  12. Larsen & Butler 2013, “Test-enhanced learning”

  13. Yang et al 2021, “Testing (Quizzing) Boosts Classroom Learning: A Systematic And Meta–Analytic Review”


(可能有人会忍不住反对,称测试只能对某些学习风格有效,也许只对语言型学习风格有效。这种判断尚未得到证实,主要是因为学习风格的实验研究质量不高,而且对于学习风格本身是否存在这一点,现存证据还众说纷纭[24])


学科

上述研究经常使用词-释义对或者单词表作为研究材料。测试效应推广到其他领域效果如何?

测试有益学习的材料:

  • 外语词汇 (eg. Karpicke & Roediger 2003, Cepeda et al 2009⁠, Fritz et al 2007[25]⁠, de la Rouviere 2012)

  • GRE 材料 (比如词汇题,Kornell 2009); 关于一般科学话题的文章 (Karpicke & Roediger, 2006a; Pashler et al, 2003)

  • 百科问答 (McDaniel & Fisher 1991)

  • 小学和中学的课程,如传记材料和科学 (Gates 1917⁠; Spitzer 1939[26] 和 Vlach & Sandhofer 2012[27]⁠ 分别研究)

  • Agarwal et al (2008): 简答测试对于教科书段落效果拔群

  • 历史教科书;一开始使用简答题而不是选择题可以更好提升保留率 (Nungester & Duchastel 1982)

  • LaPorte & Voss (1975) 也发现测试效应下保留率比选择题或再认题高

  • Duchastel & Nungester, 1981: 在测试 6 个月后,测试在回忆一段历史文本上比学习效果更好

  • Duchastel (1981):对于阅读理解历史段落,自由回忆比简答题和选择题有决定性优势

  • Glover (1989):通过自由回忆自我检测比再认或填空题⁠效果更好;主题是花朵各部分的名称

  • Kang, McDermott, and Roediger (2007):散文文章;一开始进行简答测试,在 3 天后的选择题和简答测试中成绩都很优异

  • Leeming (2002): 测试应用于学习 2 门心理学课程:心理学导论 & 记忆/学习主题;“心理学导论上(测试与学习效果为)80% 与 74%;学习和记忆主题上(测试与学习效果为)89%比80%”[28]


这些材料涵盖了相当多的所谓「陈述性」知识。将测试拓展到其他领域则更加困难,测试往往会沦为「频繁得做很多分析,而不做大局分析」,或者「进行很多琐碎练习」,或者所拓展领域中类似的行为。


第三个问题与第二个问题有关。我们提倡通过测试学习,但这种方式是否适合主题复杂的课程呢?例如斯宾诺莎哲学、莎士比亚喜剧或创意写作。当然在这类课程中,我们同意大部分形式的客观测试都是水土不服的。但我们也相信,广义上的测试效应思想仍然适用——学生应该持续思考课程主题内容并接受挑战,而不仅仅参加期中和期末考试(即使考试是写论文)。在一门斯宾诺莎的课程中,老师每周给学生安排阅读材料和引人深思的论文问题。这便是体现迁移恰当理论的每周「测试」(尽管是带回家做的考试)。持续测试要求学生持续投入到一门课程中,而不是天天划水,直到期中考试或期末考试临近才开始学习。[29]

缺点

测试确实已知有一些缺陷:

  1. 对回忆能力的干扰——回忆已测试项目的能力,会削弱回忆未测试的类似项目的能力。

    大多数/所有研究都是在实验室环境下进行的,而且干扰并不显著:

    总而言之,虽然各种类型的回忆干扰是真实存在的(也相当有趣),但我们不认为回忆干扰能否定测试增强学习的观点。这种干扰最坏也只是在一定程度上削弱测试效应的正面效果。然而测试的正面效果之明显,大多数情况下都能超过相对微小的干扰影响。

  2. 多项选择测试可能会意外地导致“负面暗示效应”,也就是有一些内容测试者已经知道是错的,但在测试中包含这些内容后,测试者却很容易认为它们是对的。

    如果能快速反馈正确答案,负面暗示效应就会减轻很多,甚至被消除(参见Butler & Roediger 2008 “Feedback enhances the positive effects and reduces the negative effects of multiple-choice testing”. 解决方法:不要用选择题;反正选择题的测试能力比自由回忆或者简答都差。

这两个问题似乎都不太严重。


下一部分:文献综述——间隔效应

编辑于 2022-01-05 09:01