想通过本贴收集一些思源 PDF 使用体验与诉求

本贴最后更新于 695 天前,其中的信息可能已经时移世改

思源使用 PDF.js 来阅读 PDF。

compressed.tracemonkey-pldi-09.pdf (mozilla.github.io)

此网站是 PDF.js 的网页阅读界面,可以拖拽本地 pdf 阅读。

因而思源也继承了许多 pdf.js 的问题,如

字体渲染发虚

10EI003PM541T38YD7N.jpg

左思源/pdf.js,右 edge

文字选中/建立批注不整齐

PluginTaskoAibMO1T44.gif

zoteroWjSrdm9M5d.gif

上思源,下 zotero

文字选中错位

24013073706f2c0c9100b4139aad11b239caafe6f.gif

pdf.js 官方回应是正在试图/暂时无法解决。

还有一些问题我提过 issue 后得到了解决,如粘贴到文档后自动处理删除换行符,切换主题或拖动标签页导致 pdf 跳页……

但上面三个问题都暂时无法解决,可能只能让 pdf.js 更新或者思源换阅读器。

群里聊天时觉得似乎只有我在逆流而上,使用思源阅读格式参差不齐的 pdf 和论文,而不是使用专业 pdf 阅读软件阅读 pdf 再复制批注到思源整理。

很多 pdf 阅读问题都因此而没有被发现和反馈从而被解决,如一个拖了很久才被发现和解决的上下方向键不能移动 pdf 的问题。

所以想用本贴来收集一些使用体验和诉求,也可以来交流使用技巧或提问。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25214 引用 • 103972 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • chenshinshi

    矩形标注可否像手形工具/文字选择工具那样提供一个常态开启设置,而不是每一次都需要快捷键或点击按钮再用鼠标来建立。

  • chenshinshi

    求建议,我的 pdf 标注由于使用了浅色系,从而在显示背景状态下不会太刺眼。

    image.png

    image.png

    上定制主题,下思源默认主题

    但隐藏背景后颜色显示效果就不明显了,

    image.png

    image.png

    有些尴尬,试图加粗边框可这样会使得显示背景的批注过粗,因为这个边框是向外延展的。暂时没想到其他样式解决。

  • 建议使用专门的 pdf 阅读器处理 pdf,然后以附件的形式在思源中保存吧。这个感觉不好处理

    1 回复
  • chenshinshi

    我本身也在用 Zotero 啦,近一个月才开始用思源自己的 pdf 然后提了一大堆 issue,亲身证明思源的 pdf 需要改进很多地方,无人使用就无人发现问题也无法解决一些可以解决的问题。

  • chenshinshi 1 赞同

    一个功能的想法:要是思源能提供一个已建立过标注的页面的汇总或者标注汇总就好了。

    1 回复
  • wenbocn

    如果能够自动提取 PDF 元数据的文件名的话,对于英文文献的阅读将会有极大的帮助。

  • Sheep

    目前希望有类似于 Obsidian 的 bookmaster 插件,将 pdf 的批注渲染一下。

  • yinyon 2 赞同 via macOS

    强烈要求增加一项功能:能一键将 pdf 文档的全部标注内容放入思源笔记中。

    2 回复
  • zazuone

    logseq 中有这个功能

  • Actiongetpower 1 赞同

    请问目前思源的 pdf 阅读,标注后不能自动粘贴到笔记内?只能手动?

  • NieJianYing 1 赞同

    有汇总!路径:\data\assets,有跟 pdf 名对应的,扩展名为“.sya"的文件,里面记录了:

  • bluefoam

    手机端点击笔记中的 pdf 标注链接, 可以打开 pdf, 但是不能将 pdf 页面定位到原标注的锚点位置, 只是停留在首页. 期望尽快解决.

  • sunduo

    希望思源能把 PDF 双链功能一直做下去,我个人是把它当成核心功能来使用思源笔记的,在 win 上思源的 PDF 标注链接是我用的最舒服的,非常灵活,还能结合思源笔记的其他功能,比如全局搜索快速定位锚文本,进而快速定位书籍中我想翻阅的内容等等。PDF 双链这个功能,我真的觉得做好了可以成为思源笔记的一大特色,是其他 PDF 阅读软件和笔记软件不具备的,它和“思源”的含义也不谋而合,书籍文献等等 PDF 也是我们知识的重要来源。我的书籍阅读笔记体系已经建立在思源笔记上很久了,感谢 D 大和 V 姐,永远尽我所能支持你们,加油!

  • fcjld 1 赞同

    通过阅读 pdf 并标注后形成笔记应该是大部分人的使用习惯,目前思源笔记对于 pdf 的标注和双链非常不方便,便利性基本等于零。

    扫描版的 pdf 无法标注高亮,扫描版的 pdf 只能通过矩形标注后手动复制到块,实现双链。

    另外查阅论坛发现可以配置 ocr,但好像没有关闭自动 ocr 的功能,导致导入扫描版 pdf 后占用时间和资源进行 ocr,但阅读 pdf 并不需要全部进行 ocr。帖子: 增加 OCR 开关

    最后希望可以实现矩形标注后,静默 ocr 并复制到剪切板,或者支持自动复制到笔记中。

    这样处理后,思源笔记可以在这块领先其他软件了

  • fcjld

    今天我也发现了 pdf 标注后复制标注结果是偏移的。

  • CSMsamuel

    本人使用思源是因为一直找不到做批注时支持插入 tex 公式的 pdf 阅读器。似乎 zotero 可以通过插入笔记的形式实现,但我希望的是对 pdf 的某个部分高亮并做公式批注。

    我之前给思源提过 issue,目前可以通过绑定块的方式给高亮内容绑定批注,但(1)需要我把公式块等等手动先合并为超级块再绑定到高亮处;(2)需要我单开一个文档来存放这些批注。只能说目前只是折衷的方案。

请输入回帖内容 ...

推荐标签 标签

  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    21 引用 • 245 回帖 • 227 关注
  • V2Ray
    1 引用 • 15 回帖
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    184 引用 • 1015 回帖 • 1 关注
  • jQuery

    jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。

    63 引用 • 134 回帖 • 735 关注
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    99 引用 • 367 回帖
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    107 引用 • 127 回帖 • 341 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 1 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 486 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 644 关注
  • 设计模式

    设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的一般问题的解决方案。这些解决方案是众多软件开发人员经过相当长的一段时间的试验和错误总结出来的。

    200 引用 • 120 回帖 • 4 关注
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    6 引用 • 141 回帖 • 2 关注
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 532 关注
  • RemNote
    2 引用 • 16 回帖 • 7 关注
  • SQLite

    SQLite 是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。SQLite 是全世界使用最为广泛的数据库引擎。

    5 引用 • 7 回帖
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    315 引用 • 547 回帖
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 110 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    95 引用 • 901 回帖
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    431 引用 • 1250 回帖 • 596 关注
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 6 关注
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    12 引用 • 5 回帖 • 637 关注
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 246 关注
  • Office

    Office 现已更名为 Microsoft 365. Microsoft 365 将高级 Office 应用(如 Word、Excel 和 PowerPoint)与 1 TB 的 OneDrive 云存储空间、高级安全性等结合在一起,可帮助你在任何设备上完成操作。

    5 引用 • 34 回帖
  • Typecho

    Typecho 是一款博客程序,它在 GPLv2 许可证下发行,基于 PHP 构建,可以运行在各种平台上,支持多种数据库(MySQL、PostgreSQL、SQLite)。

    12 引用 • 67 回帖 • 451 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    6 引用 • 26 回帖 • 547 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    5 引用 • 16 回帖 • 4 关注