传说哥! 解决文章自动获取笔记标题问题, 支持微信公众号标题获取..

实际上集市已经有获取标题的插件,但是不能获取微信公众号的文章,主要是网站有反扒,然后我们这个对公众号加了特别的支持.(搞起来挺难的...)

其次是不支持直接输入链接后获取,需要右键复制为链接,非常麻烦

文档链接自动获取标题

  1. 支持历史文档的链接获取
  2. 新输入的链接的标题自动获取(需要把网址设置为思源的超链格式)PixPin20251016123936.gif

传送门:

[10.21 更新] 传说哥! 我跑路了! 思源体验增强包! 双向链接全新体验打造! 聚焦模式变禅模式! 文档历史数据还原!! 自动获取标题链接! 标签终极增强! 块缩进! 批量修改颜色! 引用! 大纲! 批量标题! 太多了, 屌炸了! 用了后爽死了..

  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    28446 引用 • 119783 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • 我看了下用 ifrrame 不会受到同源策略的影响吗?都能获取到吗?

    https://gitee.com/shaoxiayo/siyuan/blob/master/main.js#L1817

    1 回复
  • shaoxia

    不是 iframe 的问题,你问的其实是逆向领域的问题,本质上网站是有反扒机制,会检测很多浏览器特征,要把这些东西去掉,之前我看你的代码是加了 agent,那是远远不够的,这种针对性的安全抵抗,没有办法做统一通用的适合所有反扒网站的策略.除非用 ai..但是 ai 基于无头模式,实际上也会有检测,当然除非研究的非常深,甚至需要把 chrome 的底层修改,思源是明显做不到的.而且为了做个插件投入无穷的尽力做对抗不值得..

    1 回复
  • 没太懂,感觉有点矛盾啊

    你回复说很难破解防盗,确实没错,但帖子又说可以抓取公众号文章,我看了你的代码是用 getTitleFromOpenedIframe 这个函数抓取的,这不会因为同源策略拿不到信息吗?还是公众号这个特殊,其他第三方不一定能拿到?

    我的理解,虽然你说的很难破解,但我觉得 iframe 里可以和真实浏览器一样,让防盗无法区分,我觉得最主要的问题是 iframe 同源策略影响,拿不到数据。

    至于思源中 iframe 是否能通过防盗就不知道了。

    1 回复
  • shaoxia

    跨域问题有,但是解决了

    难得是反爬

    你说的函数名,我自己都忘记了,有好几个策略并行的...不只是 iframe.我测试了 4,5 个方法做备用

    1 回复
  • 哈哈,明白了,这个厉害了。

    无论是能解决 iframe 跨域(非其他方法绕过)还是能直接解决防盗问题,都能有效抓取到数据。

    但遗憾的是目前没有完美简单的方法。

    或者只能针对特殊网站做一些特殊处理吧,比如我之前通过一个 cookie 解决了知乎的防盗问题,但是很久没用了,不知道是否还管用,或许知乎早已升级失效了吧。

    我的网址收藏之所以选择油猴脚本解决,是因为大多数收藏场景在浏览器,用油猴脚本能有效解决防盗且相对轻量简单,之前也想过多方案保障,但感觉使用率不是太高且占资源,感觉极个别有问题的,完全可以手动填下或者浏览器打开后再抓取。

    1 回复
    1 操作
    wilsons 在 2025-10-16 14:52:02 更新了该回帖
  • shaoxia 1 赞同

    你理解的基本是正确的,通过登录态拿数据是一种手段,但是肯定是有限制,比如单位时间内只能请求 100 次.

    跨域问题,本身不难解决,只要模拟好 agent 就行了

    难点不是 iframe,是浏览器,electron 内请求,就像 python 构造请求函数那样,主要问题是你没有做环境模拟,打造成一个真实的用户请求的环境,比如浏览器指纹什么的,还有一些列的安全检测也要过.

    然后每个做反爬的网站都是各有各的,用传统方法没法做通杀,ai 出来后,是可以做到的,要不 gpt 那些厂家也没法爬全网数据,但是他们不仅仅是纯代码层的优化,还做了浏览器层面的深度定制.对于我们来说思源是做不到的,而且这么做也消耗 token 很多,没必要.

    换言之,它就是个笔记软件,还想它怎么样

    我们就是为爱发电做插件,还想怎样..

请输入回帖内容 ...
shaoxia
论坛发帖更新扣积分,积分用完了,跑路了,江湖重此留下了哥的3万行代码和传说 深圳

推荐标签 标签

  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 633 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    173 引用 • 1559 回帖
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    110 引用 • 153 回帖
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 563 关注
  • 千千插件

    千千块(自定义块 css 和 js)
    可以用 ai 提示词来无限创作思源笔记

    32 引用 • 69 回帖
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    127 引用 • 169 回帖
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    105 引用 • 908 回帖
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    33 引用 • 108 回帖
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 2 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 284 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖 • 1 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 11 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    151 引用 • 257 回帖 • 1 关注
  • GraphQL

    GraphQL 是一个用于 API 的查询语言,是一个使用基于类型系统来执行查询的服务端运行时(类型系统由你的数据定义)。GraphQL 并没有和任何特定数据库或者存储引擎绑定,而是依靠你现有的代码和数据支撑。

    4 引用 • 3 回帖 • 11 关注
  • Follow
    4 引用 • 13 回帖 • 19 关注
  • sts
    2 引用 • 2 回帖 • 260 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 691 关注
  • 电影

    这是一个不能说的秘密。

    125 引用 • 610 回帖
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 545 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 123 关注
  • Unity

    Unity 是由 Unity Technologies 开发的一个让开发者可以轻松创建诸如 2D、3D 多平台的综合型游戏开发工具,是一个全面整合的专业游戏引擎。

    27 引用 • 7 回帖 • 92 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    51 引用 • 200 回帖 • 2 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖 • 1 关注
  • Shell

    Shell 脚本与 Windows/Dos 下的批处理相似,也就是用各类命令预先放入到一个文件中,方便一次性执行的一个程序文件,主要是方便管理员进行设置或者管理用的。但是它比 Windows 下的批处理更强大,比用其他编程程序编辑的程序效率更高,因为它使用了 Linux/Unix 下的命令。

    126 引用 • 83 回帖 • 1 关注