我又不少资料在思源里面,我打算用它做个 cursor 的知识库,类似的案例是 obsidian+cursor。
现在存在一个问题,ob 的数据他是.md 明文存储的,直接可读,思源的加密了。
这个选择自己的文件不加密吗?
或者有办法让 cursor 获取吗?
我又不少资料在思源里面,我打算用它做个 cursor 的知识库,类似的案例是 obsidian+cursor。
现在存在一个问题,ob 的数据他是.md 明文存储的,直接可读,思源的加密了。
这个选择自己的文件不加密吗?
或者有办法让 cursor 获取吗?
思源自带的那个 web 端肯定是不行,没有给每个文档搞一个 url,抓不到,一般那种爬虫是从根目录找页面里内容和链接,一层一层的抓,你看下 Algolia 的配置就明白了,思源没有这个
我之前用 IMA 的时候,它本身是基于浏览器开发的,所以可以在里面直接打开思源的地址,然后可以直接一键把当前页加入到它的知识库,不过因为思源没有独立的 url,所以就很蛋疼了,而且有些 ai 助手的一键总结也会因为这个问题导致无法正常使用,所以想还是要自己搭个平台,把思源当成一个数据库,直接对接思源的 api 就行了
而且,如果像 cusor 这样是按站点爬取的方式,其实后续可以单独写个页面,从思源查询最近更新过的文档列表,这样让 cusor 只抓这个页面里的数据做增量更新即可
这也是我所担忧的,未来与开放式的 AI 交互肯定是基于 md 格式的。
思源有没有什么比较好的办法?比如提供一个孪生 md 库,实时或者定时更新。
这种孪生关系应是单向的,也就是对 json 的修改会改变 md,但对 md 的修改不会改变 json,md 始终向 json 看齐。
至于要用 AI 对 md 润色,怎么作用到 json 上?最简单的方式就是直接全文覆盖,由此带来的块 id 的改变,双链的丢失由用户自己负责。毕竟 AI 本来就是用来处理纯 md,就不应该有什么双链、块 id 之类的东西。
或者针对 AI 润色这样来考虑。保证 AI 润色后,段落数量保持不变,这样就能让新旧段落一对一替换而不改变块 id。但 AI 有幻觉现象,这样做还是要谨慎。谨慎一点的话,还是让用户一段一段地确认。
有什么新发现就分享给大家吧!
Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。
Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。
SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。
gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。
Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。
FreeMarker 是一款好用且功能强大的 Java 模版引擎。
SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。
Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。
锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。
应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。
持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。
星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网
程序员是从事程序开发、程序维护的专业人员。
大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。
阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。
发布对别人有帮助的原创内容是最好的 SEO 方式。
Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。
昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。
阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。
Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。
SpaceVim 是一个社区驱动的模块化 vim/neovim 配置集合,以模块的方式组织管理插件以
及相关配置,为不同的语言开发量身定制了相关的开发模块,该模块提供代码自动补全,
语法检查、格式化、调试、REPL 等特性。用户仅需载入相关语言的模块即可得到一个开箱
即用的 Vim-IDE。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于