想通过本贴收集一些思源 PDF 使用体验与诉求

本贴最后更新于 810 天前,其中的信息可能已经时移世改

思源使用 PDF.js 来阅读 PDF。

compressed.tracemonkey-pldi-09.pdf (mozilla.github.io)

此网站是 PDF.js 的网页阅读界面,可以拖拽本地 pdf 阅读。

因而思源也继承了许多 pdf.js 的问题,如

字体渲染发虚

10EI003PM541T38YD7N.jpg

左思源/pdf.js,右 edge

文字选中/建立批注不整齐

PluginTaskoAibMO1T44.gif

zoteroWjSrdm9M5d.gif

上思源,下 zotero

文字选中错位

24013073706f2c0c9100b4139aad11b239caafe6f.gif

pdf.js 官方回应是正在试图/暂时无法解决。

还有一些问题我提过 issue 后得到了解决,如粘贴到文档后自动处理删除换行符,切换主题或拖动标签页导致 pdf 跳页……

但上面三个问题都暂时无法解决,可能只能让 pdf.js 更新或者思源换阅读器。

群里聊天时觉得似乎只有我在逆流而上,使用思源阅读格式参差不齐的 pdf 和论文,而不是使用专业 pdf 阅读软件阅读 pdf 再复制批注到思源整理。

很多 pdf 阅读问题都因此而没有被发现和反馈从而被解决,如一个拖了很久才被发现和解决的上下方向键不能移动 pdf 的问题。

所以想用本贴来收集一些使用体验和诉求,也可以来交流使用技巧或提问。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    26768 引用 • 111553 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • chenshinshi

    矩形标注可否像手形工具/文字选择工具那样提供一个常态开启设置,而不是每一次都需要快捷键或点击按钮再用鼠标来建立。

  • chenshinshi

    求建议,我的 pdf 标注由于使用了浅色系,从而在显示背景状态下不会太刺眼。

    image.png

    image.png

    上定制主题,下思源默认主题

    但隐藏背景后颜色显示效果就不明显了,

    image.png

    image.png

    有些尴尬,试图加粗边框可这样会使得显示背景的批注过粗,因为这个边框是向外延展的。暂时没想到其他样式解决。

  • 建议使用专门的 pdf 阅读器处理 pdf,然后以附件的形式在思源中保存吧。这个感觉不好处理

    1 回复
  • chenshinshi

    我本身也在用 Zotero 啦,近一个月才开始用思源自己的 pdf 然后提了一大堆 issue,亲身证明思源的 pdf 需要改进很多地方,无人使用就无人发现问题也无法解决一些可以解决的问题。

  • chenshinshi 1 赞同

    一个功能的想法:要是思源能提供一个已建立过标注的页面的汇总或者标注汇总就好了。

    1 回复
  • wenbocn

    如果能够自动提取 PDF 元数据的文件名的话,对于英文文献的阅读将会有极大的帮助。

  • Sheep

    目前希望有类似于 Obsidian 的 bookmaster 插件,将 pdf 的批注渲染一下。

  • yinyon 2 赞同 via macOS

    强烈要求增加一项功能:能一键将 pdf 文档的全部标注内容放入思源笔记中。

    2 回复
  • zazuone

    logseq 中有这个功能

  • Actiongetpower 1 赞同

    请问目前思源的 pdf 阅读,标注后不能自动粘贴到笔记内?只能手动?

  • NieJianYing 1 赞同

    有汇总!路径:\data\assets,有跟 pdf 名对应的,扩展名为“.sya"的文件,里面记录了:

  • bluefoam

    手机端点击笔记中的 pdf 标注链接, 可以打开 pdf, 但是不能将 pdf 页面定位到原标注的锚点位置, 只是停留在首页. 期望尽快解决.

  • sunduo

    希望思源能把 PDF 双链功能一直做下去,我个人是把它当成核心功能来使用思源笔记的,在 win 上思源的 PDF 标注链接是我用的最舒服的,非常灵活,还能结合思源笔记的其他功能,比如全局搜索快速定位锚文本,进而快速定位书籍中我想翻阅的内容等等。PDF 双链这个功能,我真的觉得做好了可以成为思源笔记的一大特色,是其他 PDF 阅读软件和笔记软件不具备的,它和“思源”的含义也不谋而合,书籍文献等等 PDF 也是我们知识的重要来源。我的书籍阅读笔记体系已经建立在思源笔记上很久了,感谢 D 大和 V 姐,永远尽我所能支持你们,加油!

  • fcjld 1 赞同

    通过阅读 pdf 并标注后形成笔记应该是大部分人的使用习惯,目前思源笔记对于 pdf 的标注和双链非常不方便,便利性基本等于零。

    扫描版的 pdf 无法标注高亮,扫描版的 pdf 只能通过矩形标注后手动复制到块,实现双链。

    另外查阅论坛发现可以配置 ocr,但好像没有关闭自动 ocr 的功能,导致导入扫描版 pdf 后占用时间和资源进行 ocr,但阅读 pdf 并不需要全部进行 ocr。帖子: 增加 OCR 开关

    最后希望可以实现矩形标注后,静默 ocr 并复制到剪切板,或者支持自动复制到笔记中。

    这样处理后,思源笔记可以在这块领先其他软件了

  • fcjld

    今天我也发现了 pdf 标注后复制标注结果是偏移的。

  • CSMsamuel

    本人使用思源是因为一直找不到做批注时支持插入 tex 公式的 pdf 阅读器。似乎 zotero 可以通过插入笔记的形式实现,但我希望的是对 pdf 的某个部分高亮并做公式批注。

    我之前给思源提过 issue,目前可以通过绑定块的方式给高亮内容绑定批注,但(1)需要我把公式块等等手动先合并为超级块再绑定到高亮处;(2)需要我单开一个文档来存放这些批注。只能说目前只是折衷的方案。

  • ReyX

    还有就是使用思源笔记进行批注,如果 pdf 文档有水印在文档中间,批注中间段落文字,会一起把水印全选上,导致无法只批注这一段文字QQ20250429112759.png

请输入回帖内容 ...

推荐标签 标签

  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖 • 2 关注
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    4 引用 • 16 回帖 • 202 关注
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 530 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    46 引用 • 114 回帖 • 157 关注
  • 创业

    你比 99% 的人都优秀么?

    81 引用 • 1395 回帖 • 2 关注
  • 音乐

    你听到信仰的声音了么?

    62 引用 • 512 回帖
  • CodeMirror
    2 引用 • 17 回帖 • 177 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    77 引用 • 37 回帖
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    315 引用 • 547 回帖
  • 自由行
    1 关注
  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    498 引用 • 934 回帖
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖 • 3 关注
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    188 引用 • 832 回帖
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 187 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    302 引用 • 772 回帖
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    42 引用 • 130 回帖 • 255 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖 • 2 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 636 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 14 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    730 引用 • 1284 回帖
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 644 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 475 关注
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 234 回帖 • 2 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    127 引用 • 169 回帖
  • 笔记

    好记性不如烂笔头。

    312 引用 • 794 回帖 • 1 关注
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    20 引用 • 245 回帖 • 241 关注