coriger
关注
125952 号成员,2024-01-13 16:07:40 加入
128
个人主页 浏览
  • 思源数据库 API/ 视频 RSS 源定制 / 视频笔记

    2024-12-17 18:11

    你可以看下我这个帖子:思源视频笔记插件

    我自己用了半年,感觉大多数视频其实信息密度是比较低的,如果你是想把数据喂给 cursor 的话,我是建议不要基于文本而是基于问题来构建知识库,大部分视频内容本质上没有什么底层思维的东西,基本就是百科 + 废话的组合(当然我这里只是针对我常看的一些社科类的视频),拿这些文本数据不管做什么形式的笔记其实用处都不大,所以我自己是基于视频内容提炼核心问题,然后借助豆包之类的 ai 工具,结合视频内容以及一些书籍进行整合,把整合后的结论喂给 cursor

    打个比方,我在看三国演义第一章的时候,里面有句话叫“桓帝禁锢善类”,这个我会在思源全局搜索禁锢这个词,因为我已经把史记、资治通鉴、二十四史这些都导入到思源了,所以很快就能找到禁锢善类对应的史料,结合豆包基本就能把桓帝时期禁锢善类的前因后果了解个大概;比如刘关张自行招兵买马,我就会提出一个问题,比如东汉时期的人才政策,朝廷为什么允许州府、私人私自募兵,当然我知道是因为黄巾军,但是私自募兵后对于朝廷来说有什么影响,还有刘备先祖汉武帝时期坐酎金失侯,搜索下坐酎金失侯你会发现汉武帝时期有很多人都因为这个失候,再细致一看大概就明白为什么会这样,总之基于第一章的文本是可以提出很多这样的问题,但是这些问题都不是文本里直接体现的,视频也一样,我在看老版三国演义第一集的时候,说实在的,都没什么可做笔记的地方,它能把原著的情节完整体现出来就不容易了,还能有什么更深刻的东西

    所以我觉得大多数视频材料最多做一个时间戳引用放到文本里辅助阅读,是不太适合直接用它来搭建知识库的

  • 求助关于做知识库的问题

    2024-11-26 10:01

    要想简单的话,就手动导出,纯体力活,而且自由度高,需要哪个导哪个,增量的话看思源有没有这样的插件,如果可以按时间增量导出原文件结构,直接覆盖原来的文件夹就行了

  • “获取内核服务端口失败 Failed to get kernel serve port”的思考

    2024-11-26 09:51

    我昨天也遇到个类似的事情,6806 端口没了,命令行看了下端口的确是没有监听记录,随机端口倒是好好地,后面是直接重启了思源就好了,之前没碰到过这种情况

  • 求助关于做知识库的问题

    2024-11-26 09:47

    是的,不过前提是自己提交的内容要高质量一点,像那种直接扔一本书什么的,不太行,还是需要一定的加工

    尤其是一些还没有形成体系化的总结心得之类的,像以往基本上隔个一两天就忘了,如果说自己重头再去翻笔记效率很差,直接在知识库里语义搜索基本可以原封不动把当时思考的东西重载回来,这个是任何传统笔记都做不到的,非常适合爱思考的懒人

  • 求助关于做知识库的问题

    2024-11-26 09:41

    思源自带的那个 web 端肯定是不行,没有给每个文档搞一个 url,抓不到,一般那种爬虫是从根目录找页面里内容和链接,一层一层的抓,你看下 Algolia 的配置就明白了,思源没有这个

    我之前用 IMA 的时候,它本身是基于浏览器开发的,所以可以在里面直接打开思源的地址,然后可以直接一键把当前页加入到它的知识库,不过因为思源没有独立的 url,所以就很蛋疼了,而且有些 ai 助手的一键总结也会因为这个问题导致无法正常使用,所以想还是要自己搭个平台,把思源当成一个数据库,直接对接思源的 api 就行了

    而且,如果像 cusor 这样是按站点爬取的方式,其实后续可以单独写个页面,从思源查询最近更新过的文档列表,这样让 cusor 只抓这个页面里的数据做增量更新即可

  • 求助关于做知识库的问题

    2024-11-25 19:14

    本地库试了下,数据是最近几年知乎的热门话题,cursor 这个表现一般般啊,两百多个出处就给我归纳出 3 条

    image.png

  • 求助关于做知识库的问题

    2024-11-25 18:40

    我这里有个办法,也是我最近在做的,cursor 里面有个 Docs 功能,可以添加网址,它会自动去抓网站里的页面进行索引,类似 Algolia 的爬虫,操作如下,试了下

    image.png

    网站我是直接用 vuepress2-reco 搭的直接在 github 上自动发布,本来也是打算按之前几位说的,从思源导出 markdown 然后扔到 github 上,但是这样的话就有两份数据,而且我还打算在网站上对数据进行二次更新,所以数据同步这块是一个问题

    image.png

    不过想了想其实是可以直接写个组件对接思源的 API,下午写了个简单页面,如下图,左边菜单右边文章内容,每篇文档提供单独一个 url,这样 cursor 就能爬取思源的全量数据,笔记还是在思源里维护,搭了个外链分享平台,让第三方抓取,数据有更新直接让 cursor 重新抓取就可以了,不存在多份数据不同步的问题

    image.png

    不过 cursor 这个基于 Docs 检索的功能,刚刚检索的时候居然说还要排队,要充值 Pro 提速,本来只是想开发一个外链平台把数据喂给 IMA 的,现在这个也算是多一个选择吧

    image.png

    image.png

    image.png

    不过它这里有个问题是不会关联出处,差点意思

  • docker 版本 web 页面如何单页访问?

    2024-11-22 18:44

    把这个调成 1 就可以

    image.png

  • 希望思源官方或者可以插件支持一些主流的书籍格式的阅读

    2024-11-18 21:13

    目前使用效果最好的是 BookxNote+ 安娜的档案 +RPA+ 微信读书 +calibre

    大多数书可以在安娜找到,有些新书找不到的,可以直接写个 RPA 脚本,直接从微信读书里面抓屏拼接成 pdf,然后所有书籍都统一放在 calibre 进行管理

    BookxNote 主要用来做主题阅读,一个笔记挂 N 本主题相同的书,N 本书的笔记挂在一个思维导图上,不断的优化导图的结构和丰富其中的细节

    上面两步就解决了书籍、笔记在一块的问题

    最后整理好的思维导图导出 pdf 到 IMA 或者本地自建的知识库进行索引方便未来检索

  • AI 本地搜索会不会取代笔记软件的标签、链接、传统搜索和数据库功能?

    2024-11-17 16:19

    国内腾讯的 ima,国外 google 的 NotebookLM,或者自己搭一个本地大模型自建知识库,用了之后就知道那个才是未来方向,标签、链接、传统搜索非常低效

  • AI 功能能否增加对全库的 RAG?

    2024-11-17 15:32

    维基百科的英文网页也可以正常使用中文问答,chatgpt 里的聊天页也可以加入知识库,这个要是自己搞估计不如这些商业化产品用的方便,其实要是腾讯愿意搞,把视频加入知识库服务端那边不管是拿字幕数据还是解析音频应该也不是什么难事,现在也就是笔记那块比较简陋,但我自己用的话反而觉得现在不太需要自己记笔记了,而是不断的提问,不断的把高质量的知识点录入到知识库,让软件给我生成整合好的笔记,再看情况存入到笔记里

    像 pdf 那种一样也能解析,不过可能是文字太多,回答的不如网页这种精准,不过感觉书这块其实可以直接 BookxNote 读完做好笔记然后再导入到知识库,我试了下效果不错

    所以像这种只要你笔记记的精准,要用到的时候直接问一下就行了,根本不用花时间去整理去记忆,用多了自然就记住了

    image.png

    image.png

  • AI 功能能否增加对全库的 RAG?

    2024-11-17 14:52

    试用了下腾讯刚出的 ima,体验非常好,这块其实是刚需,比搞那些双链、标签的方便太多了,只需要不断用高质量的数据喂给模型,后续不管是输出文章还是整合观点都非常的高效,事实上传统做笔记管理笔记的方式太低效了,尤其是笔记量级到达一定程度后,管理笔记本身就费事费神,正常的逻辑是积累高质量的知识点,然后借助 AI 把这些知识点进行串联来训练我们思维联想发散的能力,光在那里打标签引用这引用那没意义,搞得越多忘得越多

    本来想说自己搭一套本地大模型的环境,然后搞插件对接思源,但看 ima 感觉现成的就挺不错的,实在是不想折腾了

    知识库里有一些从知乎上收藏的高赞回答,然后可以根据这些知识进行询问,我看了下回答的还是很全面的,当然文字风格上不像有些答主那么俏皮,但是基本准确无误,非常实用,除了基于本地知识库回答也支持全网搜索回答,如果回答的好的话也可以加入到知识库,有兴趣的可以去试用下

    image.png

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-11-10 04:19

    我看论坛里面分享的 b 站视频好像也是 360P 的,浏览器已经登录了 b 站账号好像也没起到什么效果,切换分辨率都是直接跳转到 b 站

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-11-10 04:12

    这个我试了挺久的没找到什么好的方式,我自己用的话,基本上能在 youtube 找到视频源的就不看 b 站的

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-08-20 07:36

    1、先配置好参数,下载按钮才能正常调用

    2、笔记模式那个按钮不是插件的内容,可以忽略

    3、你找到的 5 个元素中,注意看节点的 data-url 属性,里面的值就是 notebook 字段

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-08-15 21:12

    思源里面随便找一个文件夹,选择右边的更多,里面有导入菜单

    image.png

    image.png

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-08-14 18:57

    加了,已经推送到 github 上了,你下下来试试看,我自己随便测了下,有个问题是思源编辑器编辑的时候它自己有点击事件的监听,应该是有个异步拉取 block 数据的接口请求,好像会导致第一次点击暂时丢失焦点,所以使用这种自由插入时间戳的时候有时候你点击了新的位置,其实它焦点可能还在之前点击的位置上,最好是插入的时候鼠标点两次,这样焦点基本能切过来,插入的时候也能准确插入,如果你没有点击没获取到焦点的话就还是按照之前的逻辑在文档末尾追加

    我自己是用之前的两个按钮就够了,所以这次我是单独新加了两个按钮,作为这种自由插入的方式

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-08-13 22:56

    嗯,优化了下顶部的时间戳,默认加了一个 4 级标题,大纲里面点时间戳直接跳转,时间戳右边可以加一个短标题方便快速定位

    image.png

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-08-12 22:54

    类似这种效果,这样搞,还可以用上网盘的 AI 功能

  • 思源视频笔记插件 /B 站 / 百度网盘一键入库

    2024-08-12 22:53

    网盘这种可以用左右分屏的方式来搞,其实这种还更好点,基本可以适配所有站点,后面应该只有抖音、B 站、Youtube 会把视频数据用 iframe 嵌入思源,其余的都用这种左右分屏的方式搞

  • 求教下思源笔记是否有简洁的跨平台视频笔记方案

    2024-08-11 07:59

    chrome 和 edge 安装都行,推荐 chrome,按帮助文档步骤一步步来,现在实现了个大概,后面等用一段时间再优化

    coriger/siyuan-video-extension (github.com)

  • 求教下思源笔记是否有简洁的跨平台视频笔记方案

    2024-08-10 09:46

    之前是写了个简单的 demo 用分屏实现,现在打算优化下直接在思源里面跳转播放,不过还是要在思源的 web 端才能正常使用,因为我这个是用浏览器插件实现的,到时候直接在 B 站提供【选集/合集】一键入库的按钮,按照下面这个模版自动生成文档,我个人感觉是基本够用了,目前插件还有些小功能在优化,里面还有很多之前爬虫的逻辑,等后面整理的差不多再发出来

    image.png

  • 求教下思源笔记是否有简洁的跨平台视频笔记方案

    2024-08-09 21:08

    他这个相当于是给本地的视频搭了个 web 服务然后可以通过浏览器打开,脚本是拦截 url 的 t 传参然后实现自动跳转,不过如果只是本地视频这么搞有点麻烦,直接把视频扔到思源里,写个插件读取当前页的 video 也能控制实现跳转,如果是因为视频多或者视频大,那还不如把视频放到网盘里,用我说的这种方法统一管理在线和离线视频,反正我上面说的这个策略我试了下基本上只要浏览器能播放的他就能正常的做笔记,只不过有些网站 video 对象的结构不一样,有些可能包在 iframe 里又或者是有多个 video,所以这里需要根据不同网站做一些适配,其他没什么问题,至于你说的在 everything 里点视频不能播放不知道什么意思,正常不应该在思源里面点时间戳跳转吗?像这种地址 http://127.0.0.1:6806/assets/01-20170326-20240809004655-u924dbe.mp4,浏览器访问是没问题的,可以正常播放,除非是你的视频格式比较另类浏览器不能播放才转下载

  • 求教下思源笔记是否有简洁的跨平台视频笔记方案

    2024-08-09 00:18

    写一个浏览器插件就可以了,借用 edge 自带的分屏功能,左边视频右边思源,做笔记的时候直接取当前 tab 页面的 video 对象 currentTime 然后调用思源的接口写入 block,点击时间戳绑定一个点击事件让当前 tab 里的 video 对象自动跳转到指定时间,而且这个支持多视频跳转,点击时间戳判断时间戳的原始链接和左侧的 tab 链接是不是同一个视频页,如果是直接跳转时间戳,如果不是先跳转新视频页再跳时间戳,这种方案只要页面能获取 video 对象的都能支持,包括 youtube 和百度云那些

    image.png

  • 思源数据库 API/ 视频 RSS 源定制 / 视频笔记

    2024-08-05 09:05

    试了下百度云,这种机制也是可以正常使用的,字幕、ai 那些就直接用百度云提供的就行

    image.png

  • 思源数据库 API/ 视频 RSS 源定制 / 视频笔记

    2024-08-05 06:46

    如果只是做视频笔记,记录时间戳截图这些还是很容易实现的,直接在浏览器打开思源,开个分屏,左边视频右边思源,然后写个浏览器插件读取当前左边窗口的视频 video 对象,拿到对象就可以拿到时间戳或者根据时间戳自动跳转,我自己日常主要是看 youtube 和 B 站基本够用,只要是能获取 video 对象不管什么网站都可以用这种方式做笔记,我自己的工作流一般还是先从抓取开始,先抓取数据,然后看情况哪些需要精读,再创建文档做视频笔记,至于 ai 那些还是要借助第三方平台

    image.png

  • 建议虚拟引用可动态配置是否显示

    2024-06-26 22:34

    写了个简单的虚拟引用的开关,可以凑合的用,不过有个问题,就是我现在读取当前文档的虚拟引用是直接解析 dom 里面 span[data-type="virtual-block-ref"],有提供接口可以直接查询文档的所有引用吗?

    image.png

  • 建议虚拟引用可动态配置是否显示

    2024-06-25 20:03

    直接在这里面配置太麻烦,不好管理,尤其是我这种一个文档里上百个引用,没法在这里做集中配置,还是得放在页面上直接勾选方便些