
依旧标题党,嘿嘿。
一直不理解为什么市场上没人做文档或者笔记的优先级管理或者推荐系统,明明有需求的人不少呀?🤔
记得上次发帖还是插件刚发布的时候。当时只做了优先级的手动管理,问题是明显的。
- 基于概率正比于优先级轮盘赌的算法是否智能,我的态度是存疑。但是如果秉持完全控制的理念,这确实是我能想到的唯一方式
- 文档非常的多,几千篇文档,怎么可能每一篇都手动设置优先级?这也是我自己面临的困境
最近终于有空大更版本,算是对问题的一次系统性的解决。
摘要
这是继 supermemo 之后,针对本地优先的阅读/笔记的,兼顾完全控制&智能被动推荐的,兼顾优先级完全自定义&优先级自动化批量调整,的优先级管理&智能推荐系统。
同时,这篇帖子也包含了我对渐进阅读、闪卡的全部理解。
关键词:渐进阅读,闪卡,优先级,稍后阅读,智能推荐,自动化
项目信息
- 项目地址:https://github.com/ebAobS/roaming-mode-incremental-reading
- 加入 QQ 交流群:1022747685 快到碗里来 😏
什么是渐进阅读?为什么渐进阅读的核心是稍后阅读?
简单来说,渐进阅读的核心是稍后阅读,稍后阅读的两大关键问题是文档优先级管理和推荐算法
笔者当年是看这篇同时阅读上百篇文章?渐进阅读之程序员视角(IRAPP) - 知乎入门的。下面我也将尝试诠释。
相信很多人都有过这样的经历,刷到某个教程,刷到某个文章,大致看了一眼觉得很有用。但并不想马上学习研究,于是就收藏下来,准备“下次看”。但是,“下次”真的会来吗哈哈哈。收藏夹越攒越多,却一直没学习,成了赛博松鼠。
-
如今是一个信息爆炸的时代,出现以上的情况绝对不稀奇。而我认为渐进阅读正是解决这种问题非常“对症下药”的方案。
-
1,渐进阅读能让你更容易轻松开始学习。渐进阅读方法论中,只要求你对打开的材料量力而行。你只需要“佛系”的学习与处理。并不要求你学完,而只要求有所推进即可。如果遇到困难,或者说就是单纯不想学了,OK,没问题,马上学习下一个材料即可。
- 这大大减少了你进入状态的“门槛”,因为你心里预设的压力就会大大减少。我就随便看看,试试今天学这个主题有没有灵感?有,我就学一学,记一记,没有我就下一篇材料了。其实你仔细想,你“无限收藏,永不学习”背后的逻辑,正是由于这种隐形的压力导致你不想打开你的学习材料开始学习,不是吗?
-
2,渐进阅读能让你不会被“卡住”。由于“遇到困难就跳转”的机制,让更容易理解材料更先被你学习,从而有效的推进了进度,而困难的材料也在不知不觉间被消磨、拆解,而你在这个过程中并没有感受到很大的压力,正所谓“好事多磨”。
-
渐进阅读 ≠ 闪卡:
- 闪卡复习算法原理是遗忘曲线,这方面思源闪卡系统 +FSRS 算法已经足够完善。多年使用 Anki、SuperMemo 的经验告诉我,卡片的"最小信息原则"极其重要。
- 渐进阅读面对的是大段文本,先天不符合"最小信息原则"。目前大多数渐进阅读解决方案惯性地使用遗忘曲线为原理的复习算法(如 FSRS)来推荐复习文章,我个人认为这并不合理。
对于一篇洋洋洒洒的文章,很难单纯的使用记忆程度作为下次是否被推荐复习的标准。真正的标准应该是多元的,比如难度、学习进度、学习内容的重要程度、紧急程度、感兴趣程度等。
总之,渐进阅读的核心目的并不是"对抗遗忘",而是实现无压力的"稍后阅读",最终高效地同时学习大量材料。
我理解的渐进阅读三个步骤:
1. 以优先级管理和推荐算法为核心的稍后阅读
在有大量内容供你选择的时候,能有效减轻压力。你不断刷新获得新信息,实质上让大脑分配的注意力“放飞自我”,同时能激发探索欲。当你最终做出选择后,你会获得极强的心理暗示,这是你主动选择且感兴趣的东西,从而更有动力看下去,而没有那种被安排任务的被动的感觉,让学习更像刷短视频,而不是像完成工作任务。
2. 对内容的渐进式处理
这个过程大多数的解释是两个动作:摘录和制卡。但我个人认为没必要教条化,摘录和制卡不过是适应 supermemo 功能而提炼的概念而已。
只要是将原文内容向清晰化、精炼化的处理,都是可行的。其实传统的方法不论是做笔记,还是直接在原文勾画,本质都是精炼和改写。
我的方法是首先深度理解原文表达的意思。然后直接在原文进行编辑,将废话和已知知识文本全部删除,遇到有用的文本则改写、精炼、总结,使我自己一看就懂。我更喜欢这种材料越学越少的感觉,学到最后剩下的文本就全是精华。
3. 闪卡制作与复习
闪卡的制作,宁缺毋滥! 闪卡的目的是长期记忆,长期记忆是需要付出时间精力的!要像挑选结婚对象一样高标准的挑选闪卡制作! 你可以发现两者非常相似:
- 长期记忆和结婚最初的目的都是让 ta 跟随自己一辈子。
- 但是我国 2025 年前三季度全国结婚 515 万对,离婚 208 万对(数据来源:中国民政局);非常多的闪卡使用者会陷入后期复习量爆炸,以及大量无效卡片的情况。
闪卡的制作的"最小信息原则"真的很重要!再好的算法,也有适用范围,叶佬的 FSRS 固然牛 B,但是本质是为了解决减少复习量和保持记忆效果的最优化问题。它也要老老实实遵循"最小信息原则"。不带脑子的相信科学,就是迷信。千万不要看到什么东西都往闪卡里扔!我自己的制卡频率是很低的,它除了要满足"最小信息原则" 之外,还必须思考,这是不是一个需要长期记忆的知识?这类知识,我 全部记住是否现实?记住这类知识产生的效益是否值得所花费的时间精力代价?
至于复习就没啥可说的了,坚持每天刷卡就好了,当你发现有些卡复习时需要理解的时间超过 20 秒,那它的制作是有问题的,建议移除闪卡,将闪卡内容返回到渐进阅读的步骤。
本项目的功能
本着"如无必要,勿增实体"原则,渐进阅读第二,第三步骤的功能,本插件并不涉及。思源笔记本身可实现第二步,第三步可以使用其他插件或者 anki。
如何解决“文档优先级管理”和“推荐算法”两大关键问题?
- 丰富的视图与看板:力求能够简单、直接、高效、迅速的对文档优先级、浏览情况,其他参数分布情况等数据进行管理
- 智能推荐算法:用户在不同的时间,对文档的优先级判断可能是不同的,可能你在最近开发软件,那么对相关编程语言的文档优先级判断就会很高,但可能三天后开发完成,不再需要,优先级可能就会很低。基于内容相似度的智能推荐算法,将选定一些你最近的偏好文档(最近漫游的前 N 篇 + 漫游次数最多的前 M 篇)作为基准文档,计算其他文档与基准文档的相似度,相似度靠前的文档将被推荐,出现在首页里。类似于抖音、淘宝等大数据智能推荐,不应该只用来刷短视频和广告,你的知识库也值得拥有。
- 优先级对齐:当文档数量非常多时,用户不可能一篇一篇诶个设置文档的优先级,但是当文档库中大部分文档都没有被用户处理过优先级时,基于优先级的概率推荐算法就是个伪命题。有没有更加高效的,最好是可基于用户的简单反馈就能批量迭代、进化的优先级管理方法?尝试优先级对齐。当智能推荐你觉得推荐内容不错,确实符合你推荐要看的内容,那么就点击优先级对齐按钮,系统就会把推荐的文档的优先级的线性分布特征,对齐到与相似度一致,从而实现一键批量的优先级调整。长此以往,你的文档会不断进化,形成自回归,动态调整到更加正确的优先级分布,同时节约大量的时间和精力。
界面预览

📖 使用指南
📦 安装插件 - 快速开始
- 在思源笔记插件市场中搜索“漫游式渐进阅读”
- 点击安装按钮完成插件安装
- 安装完成后,顶栏和侧栏会出现插件图标
⚙️ 初始化设置 - !首次使用勿跳过!重点看第 4 步
- 右键点击顶栏插件图标进入设置页面
- 设置绝对优先级顺序漫游概率(0-1 之间)
- 2.1. 设置为 1:绝对按照优先级顺序先后漫游文档
- 2.2. 设置为 0:完全按照优先级为权重概率的轮盘赌方式漫游
- 2.3. 设置为小数:有概率按优先级绝对顺序漫游,否则轮盘赌
- 选择是否排除已访问文档,自动重载漫游,自动重置已访问文档记录
- 自定义您需要的指标以及各指标的权重百分比,点击保存,耐心等待初始化完毕,第一次可能时间较长
- 配置基准文档的选择以及候选与输出参数,自行平衡推荐质量与计算时间
- 开启或关闭“自动优先级对齐”选项,开启则快速迭代优先级,关闭而采用手动对齐则更准确
- 设置完成后点击保存
📁 筛选文档 - 选定范围
- 侧栏进入渐进学习面板
- 支持多选笔记本进行筛选,可自由组合
- 支持选择根文档、标签等方式进行筛选
- 支持自定义 SQL 的方式进行个性化定制筛选
📊 阅读与调整 - 核心步骤
- 在阅读过程中,根据实际情况调整文章指标、优先级
- 如果文档并不是你想看的,则调低
- 如果是你想看的,或者很重要,希望多被推荐,则调高
- 进行文档内容的学习、理解、摘录、制卡
- 看不完或者看累了,立即点击继续漫游进入下一篇文章,不要硬着头皮读,无压力的稍后阅读,正是渐进阅读的精髓
- 对于新文章重复上述过程
🎲 智能推荐 & 优先级对齐 - 无压力、不耗时、高效的进化迭代文档优先级
智能推荐
- 基于您最近的偏好文档(优先级高或浏览次数多)内容,推荐与其相似的其他文档
- 1.1. 选定您认为优先级最高的多少篇,以及浏览次数最多的多少篇作为基准文档合适?力求能反映您的偏好
- 1.2. 选定多少显示多少文档,多少文档参与候选,多少段落参与采样。通常数值越大,推荐越准确,但同时计算量增加,耗时增加
- 1.3. 自行调整参数,将推荐的准确度与加载性能之间做一个平衡
优先级对齐
- 将智能推荐的文档的优先级数值分布调整为与相关性百分比值的分布一致,并保持极值不变
- 2.1. 调整方法大致为将相关性值归一化,再反归一化为优先级的值。
- 2.2. 如果您的思源的文档数量极多,这个功能可大大加快您对众多文档的优先级管理。
- 2.3. 每次对齐,都是对您文档优先级分布的一次反馈,也是一次进化,不断进化不断迭代,形成“自回归”式的优先级管理,同时您也节省了时间和精力
- 2.4. 可选设置开启自动优先级对齐,适合需要快速高效笼统的将优先级分布分化的情况
📋 数据管理与可视化 - 清晰查看阅读的相关数据
- 通过面板了解漫游次数和上次访问时间
- 通过条带状点图清晰查看所有文档的优先级分布
- 点图中直接拖动调整文档优先级,相关指标会自动等比例变化
- 右击点图中某点可在新标签页打开该文档
- 通过面板的其他 tab,如优先级排序表,已漫游文档列表,漫游次数排序表等,查看和了解相关数据
- 文档优先级列表中支持拖动排序,优先级会自动变为前后两个文档的平均数
🧠 智能推荐详解 — 多锚点 TF-IDF 流程与侧边栏内联展示
智能推荐设置
- 锚点:
recent_roam_N、top_roam_M - 结果:
topK推荐条数 - 候选上限:
maxCandidates(控制计算规模) - 采样段落上限:
maxParagraphs(标题 + 头/中/尾)
推荐算法流程
- 复用筛选:继承渐进阅读的笔记本/根/标签/SQL 过滤,保持范围一致。
- 锚点选取:按
custom-roaming-last取最近 N 篇,按custom-roaming-count取漫游次数最多 M 篇,合并去重。 - 候选池:过滤后减掉锚点,按
updated排序,数量不超过maxCandidates。 - 文本采样:标题 + 头/中/尾片段,数量受
maxParagraphs限制,移除 Markdown 噪声。 - 轻量分词:中文逐字、英文单词,停用词过滤。
- TF-IDF 向量:TF 长度归一化后乘以 IDF,稀疏 Map 存储。
- 相似度:候选与各锚点做余弦,相似度取均值,降低单锚点噪声。
- 展示与闭环:侧边栏按得分排序展示;点击打开文档并刷新指标/优先级,更新漫游/访问属性。
⚙️ 优先级进化管理 — 手动实时 / 批量对齐
提供“实时调整”和“优先级对齐”两套路径,按文档规模自由切换:
- 文档少 → 手动实时调整:阅读过程中即可修改各项指标或优先级,立刻体感推荐变化。
- 文档多 → 优先级对齐:一键按照相关性百分比分布对齐被推荐文档,保留极值,适合批量维护。
无论采用哪种方式,目标都是持续演化优先级,保持推荐质量始终符合当前学习策略。
📈 漫游数据看板 — 清楚掌握各种数据
- 优先级排序表:总览所有文档的优先级天梯榜,可拖动排序
- 已漫游文档列表:掌握已经看过的文档
- 漫游次数排序表:查看频繁访问的文档天梯榜,可清零访问次数。
清晰管理相关数据,随时掌握漫游策略执行情况。
🫧 支持作者
如果漫游式渐进阅读对您的学习有所帮助,欢迎给作者点个赞或打赏一杯咖啡,这将鼓励作者持续优化和开发更多实用功能:

打赏者请添加微信好友(可选):ebAobS。请备注渐进阅读

欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于