想通过本贴收集一些思源 PDF 使用体验与诉求

本贴最后更新于 534 天前,其中的信息可能已经时移世改

思源使用 PDF.js 来阅读 PDF。

compressed.tracemonkey-pldi-09.pdf (mozilla.github.io)

此网站是 PDF.js 的网页阅读界面,可以拖拽本地 pdf 阅读。

因而思源也继承了许多 pdf.js 的问题,如

字体渲染发虚

10EI003PM541T38YD7N.jpg

左思源/pdf.js,右 edge

文字选中/建立批注不整齐

PluginTaskoAibMO1T44.gif

zoteroWjSrdm9M5d.gif

上思源,下 zotero

文字选中错位

24013073706f2c0c9100b4139aad11b239caafe6f.gif

pdf.js 官方回应是正在试图/暂时无法解决。

还有一些问题我提过 issue 后得到了解决,如粘贴到文档后自动处理删除换行符,切换主题或拖动标签页导致 pdf 跳页……

但上面三个问题都暂时无法解决,可能只能让 pdf.js 更新或者思源换阅读器。

群里聊天时觉得似乎只有我在逆流而上,使用思源阅读格式参差不齐的 pdf 和论文,而不是使用专业 pdf 阅读软件阅读 pdf 再复制批注到思源整理。

很多 pdf 阅读问题都因此而没有被发现和反馈从而被解决,如一个拖了很久才被发现和解决的上下方向键不能移动 pdf 的问题。

所以想用本贴来收集一些使用体验和诉求,也可以来交流使用技巧或提问。

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    22205 引用 • 88730 回帖 • 7 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • chenshinshi

    矩形标注可否像手形工具/文字选择工具那样提供一个常态开启设置,而不是每一次都需要快捷键或点击按钮再用鼠标来建立。

  • chenshinshi

    求建议,我的 pdf 标注由于使用了浅色系,从而在显示背景状态下不会太刺眼。

    image.png

    image.png

    上定制主题,下思源默认主题

    但隐藏背景后颜色显示效果就不明显了,

    image.png

    image.png

    有些尴尬,试图加粗边框可这样会使得显示背景的批注过粗,因为这个边框是向外延展的。暂时没想到其他样式解决。

  • 建议使用专门的 pdf 阅读器处理 pdf,然后以附件的形式在思源中保存吧。这个感觉不好处理

    1 回复
  • chenshinshi

    我本身也在用 Zotero 啦,近一个月才开始用思源自己的 pdf 然后提了一大堆 issue,亲身证明思源的 pdf 需要改进很多地方,无人使用就无人发现问题也无法解决一些可以解决的问题。

  • chenshinshi 1 赞同

    一个功能的想法:要是思源能提供一个已建立过标注的页面的汇总或者标注汇总就好了。

    1 回复
  • 如果能够自动提取 PDF 元数据的文件名的话,对于英文文献的阅读将会有极大的帮助。

  • Sheep

    目前希望有类似于 Obsidian 的 bookmaster 插件,将 pdf 的批注渲染一下。

  • yinyon 2 赞同

    强烈要求增加一项功能:能一键将 pdf 文档的全部标注内容放入思源笔记中。

    2 回复
  • zazuone

    logseq 中有这个功能

  • Actiongetpower 1 赞同

    请问目前思源的 pdf 阅读,标注后不能自动粘贴到笔记内?只能手动?

  • NieJianYing 1 赞同

    有汇总!路径:\data\assets,有跟 pdf 名对应的,扩展名为“.sya"的文件,里面记录了:

  • bluefoam

    手机端点击笔记中的 pdf 标注链接, 可以打开 pdf, 但是不能将 pdf 页面定位到原标注的锚点位置, 只是停留在首页. 期望尽快解决.

  • sunduo

    希望思源能把 PDF 双链功能一直做下去,我个人是把它当成核心功能来使用思源笔记的,在 win 上思源的 PDF 标注链接是我用的最舒服的,非常灵活,还能结合思源笔记的其他功能,比如全局搜索快速定位锚文本,进而快速定位书籍中我想翻阅的内容等等。PDF 双链这个功能,我真的觉得做好了可以成为思源笔记的一大特色,是其他 PDF 阅读软件和笔记软件不具备的,它和“思源”的含义也不谋而合,书籍文献等等 PDF 也是我们知识的重要来源。我的书籍阅读笔记体系已经建立在思源笔记上很久了,感谢 D 大和 V 姐,永远尽我所能支持你们,加油!

  • fcjld 1 赞同

    通过阅读 pdf 并标注后形成笔记应该是大部分人的使用习惯,目前思源笔记对于 pdf 的标注和双链非常不方便,便利性基本等于零。

    扫描版的 pdf 无法标注高亮,扫描版的 pdf 只能通过矩形标注后手动复制到块,实现双链。

    另外查阅论坛发现可以配置 ocr,但好像没有关闭自动 ocr 的功能,导致导入扫描版 pdf 后占用时间和资源进行 ocr,但阅读 pdf 并不需要全部进行 ocr。帖子: 增加 OCR 开关

    最后希望可以实现矩形标注后,静默 ocr 并复制到剪切板,或者支持自动复制到笔记中。

    这样处理后,思源笔记可以在这块领先其他软件了

  • fcjld

    今天我也发现了 pdf 标注后复制标注结果是偏移的。

  • CSMsamuel

    本人使用思源是因为一直找不到做批注时支持插入 tex 公式的 pdf 阅读器。似乎 zotero 可以通过插入笔记的形式实现,但我希望的是对 pdf 的某个部分高亮并做公式批注。

    我之前给思源提过 issue,目前可以通过绑定块的方式给高亮内容绑定批注,但(1)需要我把公式块等等手动先合并为超级块再绑定到高亮处;(2)需要我单开一个文档来存放这些批注。只能说目前只是折衷的方案。

请输入回帖内容 ...

推荐标签 标签

  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    20 引用 • 7 回帖 • 2 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    26 引用 • 222 回帖 • 173 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    408 引用 • 3573 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 2 关注
  • 分享

    有什么新发现就分享给大家吧!

    248 引用 • 1792 回帖
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    124 引用 • 169 回帖
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 480 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    179 引用 • 407 回帖 • 493 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用 • 3 关注
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 509 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 324 关注
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    105 引用 • 127 回帖 • 391 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 119 关注
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    6 引用 • 38 回帖 • 1 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖
  • Laravel

    Laravel 是一套简洁、优雅的 PHP Web 开发框架。它采用 MVC 设计,是一款崇尚开发效率的全栈框架。

    20 引用 • 23 回帖 • 722 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    29 引用 • 66 回帖 • 2 关注
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 1 关注
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    176 引用 • 815 回帖
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    91 引用 • 384 回帖
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 584 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    186 引用 • 318 回帖 • 306 关注
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    339 引用 • 708 回帖 • 1 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖