我在每周固定获取信息流

信息流 每周信息梳理
  • 上周

    • 时间花费

      • 没有每天看新闻, 之前我都有每天看 folo 的习惯

      • 但是考虑到信息焦虑, 我依然开始使用 perplexity 看信息, 然而这比我之前花费的时间少多了

      • 但是我依然在看 bili, 看 zhihu

        • 对于 bili, 我认为这个平台已经没有优质内容了, 即使有, 也是藏在一堆 💩 里面, 要找到这些, 就必须先找 💩, 里面更多的是用夸张手法讲述一些何不食肉糜的东西, 或者整活, 或者搞慈善, 都是一些消费人群注意力, 消费人群同情心的内容, 而不是真正给人带来快乐

          • 在这个平台我无法得到优质信息, 而一些分析国际形势的博主比如小王, 比如玉渊谭天, 做的视频越来越水并且慢慢靠近主流价值观, 在我看来, 获取信息的密度和有效性不如我在 perplexity 上面问两下
        • 对于 zhihu

          • 那真是烂中烂, 热搜上十个热搜, 可能就两三个实时, 其他的是"假如...", "为什么年轻人...", 这种意淫以及以偏概全的内容

          • 但是这个平台很奇葩, 一方面大量无法自主思考, 情绪发言的用户能够获得评论权, 一方面又有大量的高知分子在里面解答问题, 而通过权重, 将评论发言分层, 让大家进入一个回答, 首先看到的就是经过思考后的内容, 但是一旦往下翻, 就会发现逐渐主观化和情绪化

          • 所以我建议找到领域内博主, 使用油猴插件找到博主的所有的信息

            • 这里分享我用 ai 写的一个脚本

            • 实测很好用

              • // ==UserScript== // @name 知乎用户内容爬取器 (全自动网页解析版) // @namespace http://tampermonkey.net/ // @version 2025.06.19.8 // @description 一键全自动抓取用户所有回答、文章和想法。通过模拟滚动和跨页面状态管理,实现全自动流程。已修复文章URL路径及404页面中断问题。 // @author Gemini // @match https://www.zhihu.com/people/*/* // @icon https://static.zhihu.com/static/favicon.ico // @grant GM_addStyle // @grant GM_getValue // @grant GM_setValue // @grant GM_deleteValue // @require https://cdn.jsdelivr.net/npm/turndown/dist/turndown.js // @require https://cdn.jsdelivr.net/npm/showdown/dist/showdown.min.js // ==/UserScript== (function() { 'use strict'; // --- 初始化服务 --- const turndownService = new TurndownService({ headingStyle: 'atx', codeBlockStyle: 'fenced' }); const showdownConverter = new showdown.Converter(); // --- UI界面 --- function setupUI(job) { if (!document.getElementById('crawler-panel')) { GM_addStyle(` #crawler-panel { position: fixed; bottom: 20px; right: 20px; width: 220px; background-color: #f9f9f9; border: 1px solid #ccc; border-radius: 8px; z-index: 9999; padding: 15px; box-shadow: 0 4px 8px rgba(0,0,0,0.1); font-size: 14px; color: #333; display: flex; flex-direction: column; gap: 10px; } #crawler-btn, #crawler-cancel-btn { border: none; padding: 10px; border-radius: 5px; cursor: pointer; font-weight: bold; transition: background-color 0.3s; } #crawler-btn { background-color: #0084ff; color: white; } #crawler-cancel-btn { background-color: #e74c3c; color: white; } #crawler-btn:disabled { background-color: #ccc; cursor: not-allowed; } #crawler-status { text-align: center; font-weight: 500; color: #555; word-wrap: break-word; min-height: 2em; display: flex; align-items: center; justify-content: center; } `); const panel = document.createElement('div'); panel.id = 'crawler-panel'; document.body.appendChild(panel); } const panel = document.getElementById('crawler-panel'); if (job && job.isRunning) { const currentSectionName = getSectionName(job.targetSections[job.currentSectionIndex]); panel.innerHTML = ` <div id="crawler-status">全自动抓取进行中...<br>当前目标: <strong>${currentSectionName}</strong></div> <button id="crawler-cancel-btn">取消任务</button> `; panel.querySelector('#crawler-cancel-btn').addEventListener('click', cancelJob); } else { panel.innerHTML = ` <div id="crawler-status">准备就绪</div> <button id="crawler-btn">开始全自动抓取</button> `; panel.querySelector('#crawler-btn').addEventListener('click', startFullAutomation); } } // --- 核心状态管理和抓取逻辑 --- // 页面加载时的主入口函数 async function main() { const job = GM_getValue('scrapingJob', null); if (job && job.isRunning) { // 【修复 1】: 检查404页面 if (document.querySelector('.ErrorPage-title')) { console.log("知乎爬取器: 检测到404页面,自动跳过。"); updateStatus('页面不存在(404),自动跳过...'); const expectedType = job.targetSections[job.currentSectionIndex]; job.scrapedData[expectedType] = `## ${getSectionName(expectedType)}\n\n该用户没有发表过任何内容,或该页面不存在(404 Not Found)。\n\n---\n\n`; job.currentSectionIndex++; GM_setValue('scrapingJob', job); if (job.currentSectionIndex >= job.targetSections.length) { finishJob(job); } else { navigateToNextSection(job); } return; // 结束在404页面的所有操作 } // 检查任务是否对当前用户有效 const currentUserId = window.location.pathname.split('/')[2]; if (job.userId !== currentUserId) { alert('检测到其他用户的抓取任务,已自动取消。'); cancelJob(); return; } } setupUI(job); if (job && job.isRunning) { await runAutomatedTask(job); } } // 启动全自动流程 function startFullAutomation() { if (!confirm('即将开始全自动抓取所有内容(回答、文章、想法)。期间页面会自动跳转,请勿关闭。要开始吗?')) { return; } const job = { isRunning: true, // 【修复 2】: 更新文章区路径为 'posts' targetSections: ['answers', 'posts', 'pins'], currentSectionIndex: 0, username: document.querySelector('.ProfileHeader-name')?.innerText || '未知用户', userId: window.location.pathname.split('/')[2], scrapedData: {} }; GM_setValue('scrapingJob', job); navigateToNextSection(job); } // 执行单个页面的自动化任务 async function runAutomatedTask(job) { const pageType = getCurrentPageType(); const expectedType = job.targetSections[job.currentSectionIndex]; if (pageType !== expectedType) { navigateToNextSection(job); return; } try { const mdContent = await scrapeCurrentPage(); job.scrapedData[pageType] = mdContent; job.currentSectionIndex++; GM_setValue('scrapingJob', job); if (job.currentSectionIndex >= job.targetSections.length) { finishJob(job); } else { navigateToNextSection(job); } } catch (e) { alert(`抓取过程中发生严重错误: ${e.message}。任务已取消。`); console.error(e); cancelJob(); } } function finishJob(job) { updateStatus('所有内容抓取完毕!正在合并...'); const finalContent = combineAllData(job); downloadAsMarkdown(finalContent, `${job.username}_知乎合集`); cancelJob(); // 清理任务 // 延迟更新UI,避免“下载完成”消息一闪而过 setTimeout(() => { if (document.getElementById('crawler-panel')) { updateStatus('全部完成!文件已下载。'); } }, 1000); } // 用于抓取当前页面的函数 async function scrapeCurrentPage() { const pageType = getCurrentPageType(); const sectionName = getSectionName(pageType); updateStatus(`正在加载【${sectionName}】,请稍候...`); await new Promise(resolve => { let lastHeight = 0; const interval = setInterval(() => { window.scrollTo(0, document.body.scrollHeight); if (document.querySelector('.List-item-end')) { clearInterval(interval); resolve(); return; } const currentHeight = document.body.scrollHeight; if (currentHeight === lastHeight) { clearInterval(interval); resolve(); } else { lastHeight = currentHeight; } }, 1000); }); updateStatus('正在展开所有“阅读全文”...'); document.querySelectorAll('.ContentItem-more, .Button.RichContent-collapsedText').forEach(b => b.click()); await new Promise(r => setTimeout(r, 1000)); updateStatus(`正在解析所有【${sectionName}】...`); let sectionContent = `## ${sectionName}\n\n`; const items = document.querySelectorAll('.List-item'); if (items.length === 0) return `## ${sectionName}\n\n该用户没有发表过任何${sectionName}。\n\n---\n\n`; for (const item of items) { const parsedMd = parseItemToMarkdown(item, pageType); if (parsedMd) sectionContent += parsedMd; } return sectionContent + '\n---\n\n'; } // 解析单个DOM节点为Markdown function parseItemToMarkdown(item, type) { try { let title = '', url = '', contentHtml = '', voteup = 'N/A'; let md = ''; const voteupElement = item.querySelector('.VoteButton--up'); if (voteupElement) voteup = voteupElement.ariaLabel.replace(/[^0-9]/ig, "") || '0'; const contentElement = item.querySelector('.RichContent-inner, .Post-RichTextContainer'); if (contentElement) contentHtml = contentElement.innerHTML; const linkElement = item.querySelector('.ContentItem-title a, .Post-Title a'); if (linkElement) url = linkElement.href; switch (type) { case 'answers': title = item.querySelector('.ContentItem-title a')?.innerText; if (!title) return null; md += `### Q: [${title}](${url})\n\n**赞同数:** ${voteup}\n**回答链接:** ${item.querySelector('.ContentItem-meta a.Link--primary')?.href}\n\n`; break; case 'posts': // 更新文章选择器 title = item.querySelector('.Post-Title a')?.innerText; if (!title) return null; md += `### 📄 [${title}](${url})\n\n**赞同数:** ${voteup}\n\n`; break; case 'pins': md += `### 📌 想法\n\n**赞同数:** ${voteup}\n`; const pinUrl = item.querySelector('.ContentItem-meta a.Link--primary')?.href; if (pinUrl) md += `**想法链接:** ${pinUrl}\n\n`; break; } if (contentHtml) md += turndownService.turndown(showdownConverter.makeHtml(contentHtml)); return md + '\n\n---\n\n'; } catch (e) { return `\n\n> [!] 此项目解析失败\n\n---\n\n`; } } // --- 辅助及工具函数 --- function navigateToNextSection(job) { const nextSection = job.targetSections[job.currentSectionIndex]; const url = `https://www.zhihu.com/people/${job.userId}/${nextSection}`; updateStatus(`即将跳转到【${getSectionName(nextSection)}】页面...`); setTimeout(() => { window.location.href = url; }, 2000); } function combineAllData(job) { let finalContent = `# ${job.username} 的知乎内容合集\n\n`; job.targetSections.forEach(section => { if (job.scrapedData[section]) { finalContent += job.scrapedData[section]; } }); return finalContent; } function cancelJob() { GM_deleteValue('scrapingJob'); location.reload(); } function updateStatus(message) { const statusEl = document.getElementById('crawler-status'); if (statusEl) statusEl.innerHTML = message.replace('\n', '<br>'); } function getSectionName(type) { return { answers: '回答', posts: '文章', pins: '想法' }[type] || '未知'; } function getCurrentPageType() { const path = window.location.pathname; if (path.endsWith('/answers')) return 'answers'; if (path.endsWith('/posts')) return 'posts'; // 识别/posts if (path.endsWith('/articles')) return 'posts'; // 兼容旧的/articles if (path.endsWith('/pins')) return 'pins'; return 'unknown'; } function downloadAsMarkdown(content, filename) { const safeFilename = filename.replace(/[/\\?%*:|"<>]/g, '-'); const blob = new Blob([content], { type: 'text/markdown;charset=utf-8' }); const dataUrl = URL.createObjectURL(blob); const a = document.createElement('a'); const date = new Date(); const dateStr = `${date.getFullYear()}${(date.getMonth() + 1).toString().padStart(2, '0')}${date.getDate().toString().padStart(2, '0')}`; a.href = dataUrl; a.download = `${safeFilename}_${dateStr}.md`; document.body.appendChild(a); a.click(); document.body.removeChild(a); URL.revokeObjectURL(dataUrl); } // --- 脚本启动 --- setTimeout(main, 1000); })();
        • 自我情绪化内容说多了, 其实就一个, 在这些平台, 我们是信息的被动接受者, 我是一个容易情绪化的人, 我不喜欢被带着跑, 所以我选择主动选择信息而不是被动接受信息

    • 心得

      • 上周也没看多少新闻

        • 但是日常生活没有更多影响, 我的阅读注意力都在微信读书和思源笔记里面, 感觉很舒服

        • 并且我也没有显现一些信息焦虑, 因为我本来就知道这些信息是可以不看的

          • 所以, 对于信息, 我们需要筛选, 筛选我们是否需要知道它
      • 对于原有的信息流程, 虽然每天接收的信息很多, 但大部分是没有用的, 看了以后没有思考, 就记住有这件事, 并且占用了我们获取自己信息的时间,这是不健康的

  • 本周

    • 这周梳理信息之后, 我发现信息太庞大了

      • image

      • 太多内容了, 难以梳理, 得找办法了

        • ai 问题解决

          • 我的流程

            • 材料收集

              • 首先处理材料, 在 folo 中游览信息内容, 然后找到需要泛读和需要精读的, 存储起来

                • 使用 siyuan 剪切, 这时候能够自动打标
            • 材料处理

              • 接着在思源中使用数据库进行梳理, 直接使用动态数据库自动添加信息内容
              • 并且对信息内容进行打标处理, 分为精读, 泛读(在材料收集阶段, 就已经过滤了不值得看的了)
            • 材料阅读

              • 对于材料要用这几个方法阅读

                • 带着问题去读
                • 原子化阅读, 遇到有效新闻, 则使用标记, 自动标记句子, 然后使用 sql 将这些标记摘取
                • 重新叙述并且关联, 将这个信息和其他信息进行双向关联, 比如使用双向链接

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • TangQi 1

    @dammy 老登的方法是正确的!!!!!!!

  • 固定来源的信息,难免变成 echo chamber,按照主题搜索,又难免遗漏,蹲一个解决方案

    1 回复
  • GloR via Android

    xs“即使有, 也是藏在一堆 💩 里面, 要找到这些, 就必须先找”深有同感,现在基本大多数自媒体平台都是这样,要是有个 ai 能帮我把不是 💩 的内容筛选出来就好了

  • DataWealth 1 评论

    folo 就是不能订阅公众号有点难受。

    信息爆炸的时代,快速筛选有用的信息是个很大的负担

    1 回复
    可以订阅啊,需要自己定制,否则只能订阅别人做过的
    MasterYS
  • TangQi

    回声室效应:指一些拥有相近想法的群体借由不断沟通与认同彼此想法,使得那些相似的想法不断被放大与加强的现象

    我觉得回声室效应对我这个流程来说不存在

    因为我不参与社交讨论, 信息放到 siyuan 以后我只会和 ai 讨论, 主流社交媒体上和你讨论这些信息内容的傻逼不如 perplexity 毛一根

    并且你可以固定时间更换自己的信息源, 比如每两个月换一次这种, 我觉得挺好的

  • TangQi

    可以的, 有网站支持, 不过要付费

    1 回复
  • 我用 distill 浏览器插件自动抓取感兴趣的网页

  • 有没有运行较长的网站推荐?一般年费在多少比较合适呢

  • 你好,思源里面这个字体挺好看的,可以给个关键词吗?

请输入回帖内容 ...

推荐标签 标签

  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    172 引用 • 1547 回帖
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 777 关注
  • 音乐

    你听到信仰的声音了么?

    62 引用 • 512 回帖 • 1 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    59 引用 • 22 回帖 • 1 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 148 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    10 引用 • 77 回帖 • 2 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 349 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 613 关注
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    29 引用 • 202 回帖 • 37 关注
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 396 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    125 引用 • 585 回帖 • 1 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖 • 1 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖 • 1 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    173 引用 • 541 回帖
  • OnlyOffice
    4 引用 • 18 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    20 引用 • 37 回帖 • 566 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    22 引用 • 148 回帖 • 15 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 42 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 1 关注
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    315 引用 • 547 回帖
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 304 关注
  • Outlook
    1 引用 • 5 回帖
  • NetBeans

    NetBeans 是一个始于 1997 年的 Xelfi 计划,本身是捷克布拉格查理大学的数学及物理学院的学生计划。此计划延伸而成立了一家公司进而发展这个商用版本的 NetBeans IDE,直到 1999 年 Sun 买下此公司。Sun 于次年(2000 年)六月将 NetBeans IDE 开源,直到现在 NetBeans 的社群依然持续增长。

    78 引用 • 102 回帖 • 714 关注