导入 500 多万字 epub 后反应速度大降

本贴最后更新于 460 天前,其中的信息可能已经时移世异

请问,设置能改变反应速度吗?还是只能升级硬件?

截屏 2023092321.34.55.png

截屏 2023092321.36.55.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23108 引用 • 93044 回帖 • 1 关注
2 操作
xnyshu 在 2023-09-23 23:05:31 更新了该帖
xnyshu 在 2023-09-23 22:36:39 置顶了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 由于思源是动态加载的,所以一般来说文档的总字数对于性能影响没那么大。

    你可以检查是不是导入 epub 后出现了内容量特别大的块,这是是确确实实会影响到反应性能的。

    1 回复
  • xnyshu

    几十万个块,怎样才能把特别大的块找出来?

    1 回复
  • 刚导进来肯定是要让思源多反应一会的

    我现在思源里面总共 2 千多万的书数据,用这着也还好

  • Bard

    这啥书呢,这么多内容

    1 回复
  • xnyshu

    一个合集。

  • drawone

    写查询语句,列出这个文档前一百个字数最多的块

    1 回复
  • xnyshu

    大神能不能展开讲讲?

    1 回复
  • drawone

    可以看看这个帖子:SQL&Query 用法记录

  • 比如你可以用这句 SQL 语句,你需要把你导入 epub 的那个文档的 ID 替换掉 的内容。

    select * from blocks where length(content) > 2000
    where root_id="<你对应的文档的 ID>";
    

    这个查询会搜索有没有字数大于 2000 的块,你可以把 2000 改成自定义的数字,比如 3000,5000 之类的。

    目前对于「多大」算是大块其实也没有一个明确的标准,但是我试了一下,我整个的我的笔记库里面大于 1000 字的块也只有一两个,所以如果你的文档里面出现了大量大容量的块,那肯定是有问题的。

    1 回复
  • 以及上面的兄弟提到的“找到文档中字数最多的块”,可以用这个代码:

    select * from blocks
    where root_id = "<文档ID>"
    order by length(content) desc limit 5;
    

    可以用 Query 挂件同时查看对应的字数

    image.png

  • xnyshu 4 评论

    照做了,没出现列表,我什么地方理解错了吗?

    你如果指的是我上面回复截图中的表格,那么这个表格需要使用集市里面的挂件「Query」。
    Frostime
    @Frostime 就是 Query 不会用,可能对程序员很简单的事,对普通人就是理解不了。难道都是程序员在用思源?很多插件挂件就是看不懂怎么用。
    xnyshu
    你点击 Query 的按钮,会跳出来一个 SQL 代码块,你需要在代码块里填写 SQL 查询语句。我在前面的回复里给了一些样例的 SQL,你把自己想要查询的文档的 ID 替换掉样例里面的字段就行了。
    Frostime
    关于 SQL 的使用,你可以看一下这篇文章: 思源 SQL 新人指南:SQL 语法 + Query + 模板
    Frostime
  • newilux 1 评论

    select * from blocks where length (content)>2000 使用这个查询语句他会把整个列表容器算作一个大块统计进来,但是整个列表分好多子块应该不影响性能,有什么办法去剔除啊

    1 回复
    请使用“type”属性进行限制
    ilovesiyuan
  • xnyshu

    既然超大块会拖慢反映速度,思源就应该对超大块有提醒。

    2 回复
  • 我个人感觉这个提醒已经比较清晰了:

    块不能太大,需要用户自行控制

    image.png

    导入往往有上千个块,找出字数多的块并不容易,都要写 sql 代码。
    xnyshu
    @xnyshu 感觉还是尽量不要导入太多东西
    JeffreyChen
  • LiulangZ

    @88250 考虑一下不大大,对超大块有提醒

请输入回帖内容 ...

推荐标签 标签

  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 5 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    11 引用 • 5 回帖 • 614 关注
  • jsDelivr

    jsDelivr 是一个开源的 CDN 服务,可为 npm 包、GitHub 仓库提供免费、快速并且可靠的全球 CDN 加速服务。

    5 引用 • 31 回帖 • 72 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    16 引用 • 130 回帖
  • PWA

    PWA(Progressive Web App)是 Google 在 2015 年提出、2016 年 6 月开始推广的项目。它结合了一系列现代 Web 技术,在网页应用中实现和原生应用相近的用户体验。

    14 引用 • 69 回帖 • 159 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 748 关注
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 538 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    127 引用 • 1706 回帖
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 479 关注
  • SpaceVim

    SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
    及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
    语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
    即用的 Vim-IDE。

    3 引用 • 31 回帖 • 104 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 59 关注
  • flomo

    flomo 是新一代 「卡片笔记」 ,专注在碎片化时代,促进你的记录,帮你积累更多知识资产。

    5 引用 • 107 回帖 • 1 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖 • 1 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 656 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖 • 2 关注
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 218 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    126 引用 • 169 回帖
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    93 引用 • 899 回帖 • 1 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    179 引用 • 407 回帖 • 491 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 226 关注
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    21 引用 • 37 回帖 • 547 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 635 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 675 关注