-
AI 搜索你的所有笔记!思源笔记 +Cursor+MCP Server——打造你的个人专属 AI 资料库!(AI 大模型搜索笔记、内容总结、大纲凝练、RAG 搜索)
2025-03-13 14:06我前几天自己写了一个,但是代码写的比较粗糙,而且依赖比较多(比如在线的嵌入式模型,停用词表),可移植性不是很好。抛砖引玉一下
大致思路:
- 实现两个 MCP tools,
siyuan_update,siyuan_search siyuan_update负责获取思源笔记内容,并向量化siyuan_search负责向量搜索,返回笔记内容
实现方面:
- 获取笔记内容,通过
/api/export/exportMdContent+SELECT id, updated FROM blocks WHERE box='{notebook_id}' AND type='d' AND updated >= {since},实现仅获取更新的笔记 - 对获取到的笔记分块,使用在线的嵌入式模型进行向量化(体验下来 bge-m3 效果比较好),使用
faiss进行向量持久化,sqlite记录分段、笔记以及向量之间的关系 - 搜索时,先处理一下 query(比如去掉停用词),然后向量化搜索,返回文档内容

- 实现两个 MCP tools,
