想通过本贴收集一些思源 PDF 使用体验与诉求

本贴最后更新于 542 天前,其中的信息可能已经时移世改

思源使用 PDF.js 来阅读 PDF。

compressed.tracemonkey-pldi-09.pdf (mozilla.github.io)

此网站是 PDF.js 的网页阅读界面,可以拖拽本地 pdf 阅读。

因而思源也继承了许多 pdf.js 的问题,如

字体渲染发虚

10EI003PM541T38YD7N.jpg

左思源/pdf.js,右 edge

文字选中/建立批注不整齐

PluginTaskoAibMO1T44.gif

zoteroWjSrdm9M5d.gif

上思源,下 zotero

文字选中错位

24013073706f2c0c9100b4139aad11b239caafe6f.gif

pdf.js 官方回应是正在试图/暂时无法解决。

还有一些问题我提过 issue 后得到了解决,如粘贴到文档后自动处理删除换行符,切换主题或拖动标签页导致 pdf 跳页……

但上面三个问题都暂时无法解决,可能只能让 pdf.js 更新或者思源换阅读器。

群里聊天时觉得似乎只有我在逆流而上,使用思源阅读格式参差不齐的 pdf 和论文,而不是使用专业 pdf 阅读软件阅读 pdf 再复制批注到思源整理。

很多 pdf 阅读问题都因此而没有被发现和反馈从而被解决,如一个拖了很久才被发现和解决的上下方向键不能移动 pdf 的问题。

所以想用本贴来收集一些使用体验和诉求,也可以来交流使用技巧或提问。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22340 引用 • 89396 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • chenshinshi

    矩形标注可否像手形工具/文字选择工具那样提供一个常态开启设置,而不是每一次都需要快捷键或点击按钮再用鼠标来建立。

  • chenshinshi

    求建议,我的 pdf 标注由于使用了浅色系,从而在显示背景状态下不会太刺眼。

    image.png

    image.png

    上定制主题,下思源默认主题

    但隐藏背景后颜色显示效果就不明显了,

    image.png

    image.png

    有些尴尬,试图加粗边框可这样会使得显示背景的批注过粗,因为这个边框是向外延展的。暂时没想到其他样式解决。

  • 建议使用专门的 pdf 阅读器处理 pdf,然后以附件的形式在思源中保存吧。这个感觉不好处理

    1 回复
  • chenshinshi

    我本身也在用 Zotero 啦,近一个月才开始用思源自己的 pdf 然后提了一大堆 issue,亲身证明思源的 pdf 需要改进很多地方,无人使用就无人发现问题也无法解决一些可以解决的问题。

  • chenshinshi 1 赞同

    一个功能的想法:要是思源能提供一个已建立过标注的页面的汇总或者标注汇总就好了。

    1 回复
  • 如果能够自动提取 PDF 元数据的文件名的话,对于英文文献的阅读将会有极大的帮助。

  • Sheep

    目前希望有类似于 Obsidian 的 bookmaster 插件,将 pdf 的批注渲染一下。

  • yinyon 2 赞同

    强烈要求增加一项功能:能一键将 pdf 文档的全部标注内容放入思源笔记中。

    2 回复
  • zazuone

    logseq 中有这个功能

  • Actiongetpower 1 赞同

    请问目前思源的 pdf 阅读,标注后不能自动粘贴到笔记内?只能手动?

  • NieJianYing 1 赞同

    有汇总!路径:\data\assets,有跟 pdf 名对应的,扩展名为“.sya"的文件,里面记录了:

  • bluefoam

    手机端点击笔记中的 pdf 标注链接, 可以打开 pdf, 但是不能将 pdf 页面定位到原标注的锚点位置, 只是停留在首页. 期望尽快解决.

  • sunduo

    希望思源能把 PDF 双链功能一直做下去,我个人是把它当成核心功能来使用思源笔记的,在 win 上思源的 PDF 标注链接是我用的最舒服的,非常灵活,还能结合思源笔记的其他功能,比如全局搜索快速定位锚文本,进而快速定位书籍中我想翻阅的内容等等。PDF 双链这个功能,我真的觉得做好了可以成为思源笔记的一大特色,是其他 PDF 阅读软件和笔记软件不具备的,它和“思源”的含义也不谋而合,书籍文献等等 PDF 也是我们知识的重要来源。我的书籍阅读笔记体系已经建立在思源笔记上很久了,感谢 D 大和 V 姐,永远尽我所能支持你们,加油!

  • fcjld 1 赞同

    通过阅读 pdf 并标注后形成笔记应该是大部分人的使用习惯,目前思源笔记对于 pdf 的标注和双链非常不方便,便利性基本等于零。

    扫描版的 pdf 无法标注高亮,扫描版的 pdf 只能通过矩形标注后手动复制到块,实现双链。

    另外查阅论坛发现可以配置 ocr,但好像没有关闭自动 ocr 的功能,导致导入扫描版 pdf 后占用时间和资源进行 ocr,但阅读 pdf 并不需要全部进行 ocr。帖子: 增加 OCR 开关

    最后希望可以实现矩形标注后,静默 ocr 并复制到剪切板,或者支持自动复制到笔记中。

    这样处理后,思源笔记可以在这块领先其他软件了

  • fcjld

    今天我也发现了 pdf 标注后复制标注结果是偏移的。

  • CSMsamuel

    本人使用思源是因为一直找不到做批注时支持插入 tex 公式的 pdf 阅读器。似乎 zotero 可以通过插入笔记的形式实现,但我希望的是对 pdf 的某个部分高亮并做公式批注。

    我之前给思源提过 issue,目前可以通过绑定块的方式给高亮内容绑定批注,但(1)需要我把公式块等等手动先合并为超级块再绑定到高亮处;(2)需要我单开一个文档来存放这些批注。只能说目前只是折衷的方案。

请输入回帖内容 ...

推荐标签 标签

  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 477 关注
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    325 引用 • 1395 回帖
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 625 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 680 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 431 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    125 引用 • 169 回帖 • 1 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 2 关注
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    176 引用 • 815 回帖
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    6 引用 • 15 回帖 • 113 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    186 引用 • 318 回帖 • 303 关注
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 175 关注
  • 创业

    你比 99% 的人都优秀么?

    84 引用 • 1399 回帖
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    351 引用 • 1814 回帖
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    567 引用 • 3532 回帖
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    55 引用 • 85 回帖 • 2 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖 • 43 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • Firefox

    Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。

    8 引用 • 30 回帖 • 407 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 628 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    88 引用 • 1235 回帖 • 411 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖 • 2 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    169 引用 • 506 回帖
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖