希望支持 Ollama 本地模型的流式输出

目前要等待 AI 输出完再显示,阻塞太久了体验很差。下面是简单的流式输出答案的代码(真实可用,仅供参考),我没开发过思源插件,也不知道官方 API 是否支持对接 AI 输出,但我觉得这个可能由官方支持比较靠谱,衷心希望官方考虑下...

async function main() { // 定义可用模型列表 const modelList = [ 'deepseek-r1:14b', 'qwen2.5' ]; // 创建 petite-vue 应用 createApp({ model: modelList[0], question: 'strawberry里有几个r', // 默认问题 output: null, // 输出内容,初始为 null history: [], // 聊天记录 // 定义异步聊天函数 async chat(question, container) { // 如果输入为空,则不执行操作 if (question === '') return // 清空输入框内容 this.question = '' // 将新问题和空的答案添加到聊天记录中 this.history.push({ question, answer: '' }) let action = this.history[this.history.length - 1] // Ollama 的 API 地址 const apiUrl = "http://localhost:11434/api/generate" // 选定的模型名称 const modelName = this.model // 发送请求到 API const resp = await fetch(apiUrl, { method: "POST", // 请求方法为 POST headers: { "Content-Type": "application/json" // 请求头内容类型为 JSON }, body: JSON.stringify({ model: modelName, // 指定使用的模型 prompt: question // 发送的问题内容 }) }) // 获取响应体的读取器,用于逐步读取流式内容 const reader = resp.body.getReader() // 创建文本解码器,将二进制数据解码为文本 const textDecoder = new TextDecoder("utf-8") // 配置 Showdown 转换器的选项 const options = { parseImgDimensions: true, /* 支持定义图片尺寸 */ tables: true, /* 启用表格语法 */ strikethrough: true, /* 启用删除线 */ tasklists: true, /* 启用待办列表 */ emoji: true, /* 启用 emoji 表情 */ splitAdjacentBlockquotes: true, /* 分离相邻的引用块 */ moreStyling: true, /* 启用更多样式支持 */ } // 使用 Showdown 转换器将答案从 Markdown 转为 HTML const converter = new showdown.Converter(options) // 循环读取 API 返回的流式内容 while (1) { const { done, value } = await reader.read() // 读取一段内容 if (done) { // 针对deepseek的思考部分 if (action.answer.includes('</think>')) { const arr = action.answer.split('</think>') const think = arr[0] + '</think>' const answer = arr[1] action.answer = think + converter.makeHtml(answer) } else { action.answer = converter.makeHtml(action.answer) } log(action.answer) log('=== END ===') // 打印结束标志 break // 退出循环 } // 解码流式内容为字符串 const answer = textDecoder.decode(value).trim() // 将流式内容按行分割并逐行处理 const arr = answer.split('\n').map(item => { log(item) // 打印每行内容 try { // 尝试将 JSON 字符串解析为对象,并返回响应内容 const obj = JSON.parse(item.trim()) return obj.response } catch (err) { // 如果解析失败,返回空字符串 return '' } }) // 将解析的内容添加到当前问题的答案中 action.answer += arr.join('') } } }).mount('#app') // 将应用挂载到页面上的 #app 容器中 }
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    25479 引用 • 105369 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • zxkmm 1 赞同

    难点不是流式输出本身,是让编辑器上有流式输出。

    另外这个并不是阻塞,只是简单的屏蔽用户操作。即使实现了流式输出也需要屏蔽用户操作,只是视觉上更好看。

    2 回复
  • 另外关于你的问题,app 暴露给插件的 API 据我所知没有和 AI 相关的。

  • WaveF via macOS

    明白了,我是做 UI 设计的,目前这种屏蔽用户操作在设计实际上有强弱之分,直接用一个进度条遮挡整个编辑器实际上属于强打断,它表现的并不只是视觉上好不好看,而是会强制打断用户思路,就好比在影院看电影时突然中途插入全屏广告。不管怎样,我也只是提个建议或者探讨,如果不希望在流式输出期间用户在编辑器本体操作,那是否可以用单独的窗口/webworker 来处理,编辑器本体只是有一个占位符块,等独立窗口完成流式输出后再把内容填充到主编辑器,这样是不是更可行?不过如果没有 AI 相关的 API 那也只能等官方了

    1 回复
    2 操作
    WaveF 在 2025-02-13 10:49:20 更新了该回帖
    WaveF 在 2025-02-13 10:48:39 更新了该回帖
  • 如果你愿意的话,插件也可以实现,单独做一套,不用官方的就行。不需要 API

  • 如何自己喂数据训练?

  • 其实可以参考 vscode 中 copilot 的方案,单独开一个侧边栏或者聊天框流式输出,然后做好跟编辑器的交互(聊天记录一键导入到思源)就行。这种阻塞体验是很差的

    1 回复
  • 那恐怕有点难哦,vscode 有块级 diff 和冲突解决。思源连同步冲突 diff 和解决都没有很完善。

请输入回帖内容 ...

推荐标签 标签

  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖 • 1 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    173 引用 • 414 回帖 • 364 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 77 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 289 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    298 引用 • 763 回帖
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    24 引用 • 241 回帖
  • 电影

    这是一个不能说的秘密。

    122 引用 • 608 回帖
  • Chrome

    Chrome 又称 Google 浏览器,是一个由谷歌公司开发的网页浏览器。该浏览器是基于其他开源软件所编写,包括 WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

    63 引用 • 289 回帖
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 61 关注
  • Sandbox

    如果帖子标签含有 Sandbox ,则该帖子会被视为“测试帖”,主要用于测试社区功能,排查 bug 等,该标签下内容不定期进行清理。

    433 引用 • 1250 回帖 • 595 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 8 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    52 引用 • 228 回帖
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 201 关注
  • 浅吟主题

    Jeffrey Chen 制作的思源笔记主题,项目仓库:https://github.com/TCOTC/Whisper

    1 引用 • 28 回帖 • 1 关注
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖 • 1 关注
  • 996
    13 引用 • 200 回帖 • 8 关注
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    174 引用 • 538 回帖
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 667 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖 • 1 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖 • 3 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 832 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 550 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖 • 2 关注
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    499 引用 • 1395 回帖 • 247 关注
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 166 关注