导入 500 多万字 epub 后反应速度大降

请问,设置能改变反应速度吗?还是只能升级硬件?

截屏 2023092321.34.55.png

截屏 2023092321.36.55.png

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    16115 引用 • 57144 回帖 • 1 关注
2 操作
xnyshu 在 2023-09-23 23:05:31 更新了该帖
xnyshu 在 2023-09-23 22:36:39 置顶了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 由于思源是动态加载的,所以一般来说文档的总字数对于性能影响没那么大。

    你可以检查是不是导入 epub 后出现了内容量特别大的块,这是是确确实实会影响到反应性能的。

    1 回复
  • xnyshu

    几十万个块,怎样才能把特别大的块找出来?

    1 回复
  • ilovesiyuan

    刚导进来肯定是要让思源多反应一会的

    我现在思源里面总共 2 千多万的书数据,用这着也还好

  • 这啥书呢,这么多内容

    1 回复
  • xnyshu

    一个合集。

  • 写查询语句,列出这个文档前一百个字数最多的块

    1 回复
  • xnyshu

    大神能不能展开讲讲?

    1 回复
  • 可以看看这个帖子:SQL&Query 用法记录

  • 比如你可以用这句 SQL 语句,你需要把你导入 epub 的那个文档的 ID 替换掉 的内容。

    select * from blocks where length(content) > 2000
    where root_id="<你对应的文档的 ID>";
    

    这个查询会搜索有没有字数大于 2000 的块,你可以把 2000 改成自定义的数字,比如 3000,5000 之类的。

    目前对于「多大」算是大块其实也没有一个明确的标准,但是我试了一下,我整个的我的笔记库里面大于 1000 字的块也只有一两个,所以如果你的文档里面出现了大量大容量的块,那肯定是有问题的。

    1 回复
  • 以及上面的兄弟提到的“找到文档中字数最多的块”,可以用这个代码:

    select * from blocks
    where root_id = "<文档ID>"
    order by length(content) desc limit 5;
    

    可以用 Query 挂件同时查看对应的字数

    image.png

  • xnyshu 4 评论

    照做了,没出现列表,我什么地方理解错了吗?

    你如果指的是我上面回复截图中的表格,那么这个表格需要使用集市里面的挂件「Query」。
    Frostime
    @Frostime 就是 Query 不会用,可能对程序员很简单的事,对普通人就是理解不了。难道都是程序员在用思源?很多插件挂件就是看不懂怎么用。
    xnyshu
    你点击 Query 的按钮,会跳出来一个 SQL 代码块,你需要在代码块里填写 SQL 查询语句。我在前面的回复里给了一些样例的 SQL,你把自己想要查询的文档的 ID 替换掉样例里面的字段就行了。
    Frostime
    关于 SQL 的使用,你可以看一下这篇文章: 思源 SQL 新人指南:SQL 语法 + Query + 模板
    Frostime
  • newilux 1 评论

    select * from blocks where length (content)>2000 使用这个查询语句他会把整个列表容器算作一个大块统计进来,但是整个列表分好多子块应该不影响性能,有什么办法去剔除啊

    1 回复
    请使用“type”属性进行限制
    ilovesiyuan
  • xnyshu

    既然超大块会拖慢反映速度,思源就应该对超大块有提醒。

    2 回复
  • a2930610542 2 评论

    我个人感觉这个提醒已经比较清晰了:

    块不能太大,需要用户自行控制

    image.png

    导入往往有上千个块,找出字数多的块并不容易,都要写 sql 代码。
    xnyshu
    @xnyshu 感觉还是尽量不要导入太多东西
    a2930610542
  • @88250 考虑一下不大大,对超大块有提醒

请输入回帖内容 ...

推荐标签 标签

  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 427 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 653 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    935 引用 • 1455 回帖 • 240 关注
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    391 引用 • 3334 回帖
  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    228 引用 • 1448 回帖
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 104 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    188 引用 • 1050 回帖 • 47 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    15 引用 • 7 回帖 • 8 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 604 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    83 引用 • 134 回帖
  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 232 回帖 • 69 关注
  • 博客

    记录并分享人生的经历。

    269 引用 • 2385 回帖
  • 脑图

    脑图又叫思维导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具。

    21 引用 • 58 回帖
  • Unity

    Unity 是由 Unity Technologies 开发的一个让开发者可以轻松创建诸如 2D、3D 多平台的综合型游戏开发工具,是一个全面整合的专业游戏引擎。

    23 引用 • 7 回帖 • 262 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    88 引用 • 345 回帖 • 1 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    80 引用 • 122 回帖 • 626 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 589 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    76 引用 • 421 回帖
  • 导航

    各种网址链接、内容导航。

    35 引用 • 168 回帖
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 391 关注
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 17 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    27 引用 • 66 回帖 • 5 关注
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    115 引用 • 99 回帖 • 302 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 1 关注
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    156 引用 • 1371 回帖
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    310 引用 • 546 回帖 • 140 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 5 关注