问题描述
如上图。我从别处导出一个名为 fp.sy 的压缩包文件,然后把它导入到另一个 siyuan 客户端,导入步骤是:我先在 siyuan 客户端中新建笔记本,命名为 fp;然后导入 fp.sy 的压缩包到该笔记本
出现如下问题:
在新的 siyuan 客户端中,调整 fp 笔记本下的文档排列顺序,然后出现上述图中的文件已存在问题;
但是,在该 fp 笔记本中新建文档,然后移动新建文档,不存在“文件已存在的问题”。
如上图。我从别处导出一个名为 fp.sy 的压缩包文件,然后把它导入到另一个 siyuan 客户端,导入步骤是:我先在 siyuan 客户端中新建笔记本,命名为 fp;然后导入 fp.sy 的压缩包到该笔记本
出现如下问题:
在新的 siyuan 客户端中,调整 fp 笔记本下的文档排列顺序,然后出现上述图中的文件已存在问题;
但是,在该 fp 笔记本中新建文档,然后移动新建文档,不存在“文件已存在的问题”。
我认为,背后原因可能是,我导出的内容,有跨笔记本引用。
我导出的 siyuan1 客户端中的 fp 笔记本,但是 fp 中某些笔记引用了 siyuan1 中的其他笔记本中的内容。这样把到处的 fp 导入到 siyuan2 客户端:可能导致上述问题,
另外我还发现,导入到 siyuan2 中的 fp 笔记本内的某些文档丢失名字,成为 Untitle。
我想导出,是因为担心数据量越来越大后,影响索引效率。
请教下,如果未来数据量太大,我还想保持高速索引,可以通过使用更强大的 cpu(多核心、更高主频)和更大内存来并行查找索引中内容来提高效率吗?
我粗略了解一些数据库索引原理,关键就是在内存中查找数据。那理论上性能更强劲 cpu 配合更大内存,可以解决索引问题?
如果我的想法正确,那我就不使用导出功能了,将来数据量太大影响检索效率,上更强劲的 cpu、更大频率更高的内存即可解决,就不用把数据分拆到好几个 siyuan 客户端了。
我现在用着索引太爽了,就怕将来不爽了痛苦。所以现在就得想好到底是把数据分开来,还是将来上更强劲的硬件。
刚刚我测试了跨笔记本引用再导出,也没有能重现问题,跨笔记本会把引用的文档一并导出的。
至于性能问题,任何软件都有一定的上限,但是作为前期使用不必太有顾虑,可以按照一个月或者三个月这样的周期测算一下数据增长情况,然后预估按照这个增长能够支持多久,如果是几年的话我觉得近期就没有必要太在乎性能影响了,几年以后升级一下硬件可能就解决问题了。
如果实在有顾虑,建议通过拆分笔记本或者工作空间来使用,但是我个人觉得这样用的话比较累,而且过度的分类规则也是种自我设限,没有太大必要。
对于数据库的性能,在个人电脑上差不多就是几十万到百万条记录差不多能够在可以接受的性能范围内,再多的话我觉得也没有多少工具能够支持全文搜索了,不信的话你可以找一些笔记软件测试一下性能,当文档数量上万以后看看全文搜索的性能差异,我相信思源还是很难能打的。
现在的情况是:siyuan2 客户端部署在 linux mint 上的 docker,而移动文件排序产生“文件已存在”的问题。【这个问题产生的原因:就是我有两个 siyuan1、siyuan2 运行在 docker,且他们的工作空间是独立的。我在网页端把 siyuan1 的文件导出,再到网页端导入到 siyuan2】
如下图所示,我在 siyuan2 客户端把 2022-11-11 文档移动到 2022-11-14 上方,立马报错,来回移动两个文件顺讯,一直报错,但是文件顺序的确能移动了。只是不爽!
随后做了如下测试:
将 siyuan2 的数据同步到云端后,关闭容器:sudo docker stop siyuan2。
再在 win10 上安装全新的 siyuan 2.5.0 客户端,,从云端同步数据库,同步完毕后,win10 客户端移动同样的文件:将 2022-11-11 和 2022-11-14 来回移动顺序,不会出错——不会出现“文件已存在”的问题。如下图
同步,退出 win10 siyuan。
在 linux 上,再 run 一个新的 siyuan3 客户端(开辟全新、独立的工作空间),导入秘钥、并把云端数据同步下来,再来回移动同样的文件的顺序(2022-11-11 和 2022-11-15),又出现文件已存在的问题。
综上,我认为原因可能是:
经过我再次测试,发现:
docker 端通过网页,问题根源是:如果被移动的文档下面还有子文档,则会提示、警告“文件已存在”问题,该提示、警告不影响文档移动、排序。如果被移动重排序的文档下方没有子文档,则不会提示、警告“文件已存在”
上述问题,win10 桌面客户端不存在。
机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。
持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。
开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。
子曰:“工欲善其事,必先利其器。”
Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。
ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。
记录并分享人生的经历。
Logseq 是一个隐私优先、开源的知识库工具。
Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.
微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。
MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。
星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。
Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。
Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。
SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。
一些有用的避坑指南。
心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。
Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。
InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。
以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。
PostgreSQL 是一款功能强大的企业级数据库系统,在 BSD 开源许可证下发布。
Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。
知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。
SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。
如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。
域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于