我又不少资料在思源里面,我打算用它做个 cursor 的知识库,类似的案例是 obsidian+cursor。
现在存在一个问题,ob 的数据他是.md 明文存储的,直接可读,思源的加密了。
这个选择自己的文件不加密吗?
或者有办法让 cursor 获取吗?
我又不少资料在思源里面,我打算用它做个 cursor 的知识库,类似的案例是 obsidian+cursor。
现在存在一个问题,ob 的数据他是.md 明文存储的,直接可读,思源的加密了。
这个选择自己的文件不加密吗?
或者有办法让 cursor 获取吗?
是的,不过前提是自己提交的内容要高质量一点,像那种直接扔一本书什么的,不太行,还是需要一定的加工
尤其是一些还没有形成体系化的总结心得之类的,像以往基本上隔个一两天就忘了,如果说自己重头再去翻笔记效率很差,直接在知识库里语义搜索基本可以原封不动把当时思考的东西重载回来,这个是任何传统笔记都做不到的,非常适合爱思考的懒人
这也是我所担忧的,未来与开放式的 AI 交互肯定是基于 md 格式的。
思源有没有什么比较好的办法?比如提供一个孪生 md 库,实时或者定时更新。
这种孪生关系应是单向的,也就是对 json 的修改会改变 md,但对 md 的修改不会改变 json,md 始终向 json 看齐。
至于要用 AI 对 md 润色,怎么作用到 json 上?最简单的方式就是直接全文覆盖,由此带来的块 id 的改变,双链的丢失由用户自己负责。毕竟 AI 本来就是用来处理纯 md,就不应该有什么双链、块 id 之类的东西。
或者针对 AI 润色这样来考虑。保证 AI 润色后,段落数量保持不变,这样就能让新旧段落一对一替换而不改变块 id。但 AI 有幻觉现象,这样做还是要谨慎。谨慎一点的话,还是让用户一段一段地确认。
思源自带的那个 web 端肯定是不行,没有给每个文档搞一个 url,抓不到,一般那种爬虫是从根目录找页面里内容和链接,一层一层的抓,你看下 Algolia 的配置就明白了,思源没有这个
我之前用 IMA 的时候,它本身是基于浏览器开发的,所以可以在里面直接打开思源的地址,然后可以直接一键把当前页加入到它的知识库,不过因为思源没有独立的 url,所以就很蛋疼了,而且有些 ai 助手的一键总结也会因为这个问题导致无法正常使用,所以想还是要自己搭个平台,把思源当成一个数据库,直接对接思源的 api 就行了
而且,如果像 cusor 这样是按站点爬取的方式,其实后续可以单独写个页面,从思源查询最近更新过的文档列表,这样让 cusor 只抓这个页面里的数据做增量更新即可
提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。
LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。
Thank God It's Friday! 感谢老天,总算到星期五啦!
又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。
Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。
JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。
本标签主要用于分享网络空间安全专业的学习笔记
“梦想从学习开始,事业从实践起步” —— 习近平
TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。
Logseq 是一个隐私优先、开源的知识库工具。
Logseq is a joyful, open-source outliner that works on top of local plain-text Markdown and Org-mode files. Use it to write, organize and share your thoughts, keep your to-do list, and build your own digital garden.
有什么新发现就分享给大家吧!
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。
WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。
WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。
子曰:“工欲善其事,必先利其器。”
程序员是从事程序开发、程序维护的专业人员。
Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。
SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
即用的 Vim-IDE。
据说 99% 的性能瓶颈都在数据库。
Postman 是一款简单好用的 HTTP API 调试工具。
链滴是一个记录生活的地方。
记录生活,连接点滴
Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用 。
HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。
jQuery 是一套跨浏览器的 JavaScript 库,强化 HTML 与 JavaScript 之间的操作。由 John Resig 在 2006 年 1 月的 BarCamp NYC 上释出第一个版本。全球约有 28% 的网站使用 jQuery,是非常受欢迎的 JavaScript 库。
快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。
Solidity 是一种智能合约高级语言,运行在 [以太坊] 虚拟机(EVM)之上。它的语法接近于 JavaScript,是一种面向对象的语言。
域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于